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Peptides ayant des proprietes iiranunologiques de HIY-=2 

La presente invention est relative a des pep- 
tides ayant des proprietes immunologiques , le cas 
ech^ant immunogenes, en commun avec des antigSnes sus- 
ceptibles d'etre obtenus sous une forme purifiee, a 
partir de virus capables de provoquer des lymphadeno- 
pathies susceptibles d'etre relayees ensuite par le 
symdrome d • imftunodef icience acquise (SIDA) chez I'homme. 

L' invention concerne en particulier des pep- 
tides antigeniques susceptibles d'etre reconnus par des 
anticorps induits chez I'homme par des virus designes 
par I'abreviation HIV, selon la nomenclature definie 
dans NATURE. Elle concernis egalement des peptides ayant 
des proprietes immunogSnes ou susceptibles d'etre rendus 
immunogenes in vivo , cette immunogenicite etant suscep- 
tible de se manif ester par 1' induction in vXvQ d' anti- 
corps reconnaissant des antigenes caracteristiquea des 
virus HIV- 2 et meme, au moins en ce qui concerne 
certains de ces peptides, des antigenes issus de HIV-I. 

L' invention concerne en outre des applications 
de ces peptides i la fabrication de compositions pour le 
diagnostic jji vitro chez I'homme de potentiality de cer- 
taines formes du SIDA et, en ce qui concerne certains 
d'entre eux, i la production de compositions immunogenes 
et de compositions vaccinantes centre les retrovirus 
HIV. 

De meme 1' invention concerne les applications 
aux memes fins des anticorps susceptibles d'etre induits 
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in vivo par les peptides inimunogenes ou rendus iminuno- 
genes et^ pour certains de ces anticorps, leurs applica- 
tions a; la production de principes actifs de medicaments 
contre. ces SIDAS humains . 

L' invention concerne egalement la mise en 
oeuvre de certains de ces peptides dans des procedes 
pour le diaJgnostic in vitro chez I'homme de certaines 
formes. *du SIDA, aiiisi que leur" application S la consti- 
tution de trousses ou ''kits" de diagnostic. 

Un premier retrovirus denomme LAV-1 ou HIV-1 a 
ete isole et decrit dans la demande de brevet 
GB. 83/24. 800 et line demande EP. 84/401 .834 du 14/09/84. 
Ce virus a egalement ete decrit par F.Barre Sinoussi et 
al. dans Science, 220 n* 45^99, 20. pages 868-871. 

Des' variants de ce virus HIV-1 designes par 
LAV- ELI et LAV MAL, ont egalement ete isoles, caracte- 
rises et . decrits dans la demande de brevet EP.84/- 
40.1.834. 

Les virus HIV-t et leurs variants possedent 
les proprietes suivantes : 

- ils ont pour cibles pref erencielles les 

cellules Leu3 (ou lymphocytes T4) humaines et leurs 

cellules derivees ''immortalisees" . 

T ils ont une activite transcriptase inverse 

2+ 

necessitant la presencie d*ions Mg et presentent une 



fqrte activite pour le polyCadenylate-oligo-deoxythymi- 
dylase) poly(A>-oligo(dT) 12-18) 

- ils ont une densite de 1,16 a 1,17 sur 
gradient de sucrose, 

- ils ont un diametre moyen de 139 nanometres 
et un noyau de diam^atre moyen de 41 nanometres, 

- les lysats de ces virus contiennent une 
proteine p25 (proteine du noyau) qui ne croise pas im- 
munologiquement avec la proteine p24 de HTLV-1, 

25 - ils contiennent une proteine p42 appartenant 

a leur ehveloppe. 
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ils contiennent egalement une glycoproteine 
d'enveloppe gp110 d'un poids moleculaire de 110.000. 

L'isolement et la caracterisation de retro- 
virus appartenant a une classe distincte et n'ayant 
qu'une parente immunologique reduite avec les prece- 
^ dents, ont ete decrits dans la demande de brevet euro- 
peen n' 87/400,151.4. Ces retrovirus qui ont ete regrou- 
pes sous la designation HIV-2, ont dte isoles chez plu- 
sieurs malades africains presentant des symptomes d'une 
lymphadenopathija ou d'un SIDA. 

Les retrovirus du type HIV-2 comme les retro- 
virus du type HIV-1, se caracterisent par un tropisme 
pour les lymphocytes T4 humains et par un effet cyto- 
pathogene a 1 ' egard de ces lymphocytes, lorsqu'ils s'y 
multiplient, pour alors causer soit des poly-adenopa- 
thies generalisees et persistantes , soit un SIDA. 

Plus generalement les retrovirus purifies par 
HIV-2 possedent en general les proprietes suivantes : 

- la cible pref erentielle des retrovirus ^HIV-2 est cons- 
tituee par les cellules Leu3 (ou lymphocytes T4) humai- 
nes et pour des cellules "immortalisees" deriv^es de ces 
lymphocytes T4 ; 

- ils sont cytotoxiques pour les lymphocytes T4 humains 

- ils ont une activite de transcriptase inverse neces- 

2+ 

sitant la presence d'ions Mg et presentant une forte 
activite pour le poly (adeny late-oligodeoxy thy Imidylase) 
(poly{A)-oligo(dT) 12-18) ; 

- ils ont une densite de 1,16 dans un gradient de 
sucrose ; 

ils ont un diametre moyen de 140 nanometres et un 
noyau ayant un diametre moyen de 41 nanometres ; 

- ils peuvent etre cultives dans des lignees permanentes 
du type HUT ou exprimant la proteine T4 ; 

- ils ne sont pas infectieux pour les lymphocytes T8 ; 
les lysats de ces virus contiennent une proteine p26 

35 
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qui ne croise pas immiinologiquement avec la proteine p24 
du virus HTLV-I ou du virus HTLV-II ; 

ces lysats contiennent en outre une. proteine p16 qui 
n'est pas reconnue xmmunologiquement par la proteine p19 
5^ de HTLV-I ou de HtLV-il dans des essais de radioimmuno- 
precipitation ^ 

- ils contiennent en outre une glycoproteine d'enveloppe 
ayant un poids moleculaire de l*ordre de 1 30. 000- t 40. 000 
qui ne croise pas immunologiquement avec la gpHO des 

IQ HIV-t, mais qui en revanche croise inununologiquement 
aivec la glycoproteine d'enveloppe gp140 de STLV-III (vi- 
rus isole chet le singe) ; 

- ces lysats contiennent encore des antigenes marquables 
par la ^^S-cysteiner dont les poids moleculaires s'eta- 
gent entre 32'. 000 et 42.000-45.000 : ils comprennent no- 
tammeat un antigene ayant un poids moleculaire de I'or- 
dre de 36,000 et. un antigene ayant un poids moleculaire 
de I'ordre de 42.000, I'lui de ces antigenes Cp36 et p42) 
constituant vraisemblablement . une glycoproteine trans-^ 

2Q membranaire du virus HIV-2 ; 

- I'ARN genomique des HIV-2 n'hybride pas avec I'^ARN 
genomique de HIV-I dans des conditions stringentes ; 

- dans des conditions non stringentes, I'ARN genomique 
de HIV-2 n'hybride, ni avec le gene env ^ et le LTR qui le 

25 jouxte, de HIV-1 , ni avec des sequences de la region pol 
du genome de HIV-1 ; 

- dans des conditions non stringentes, il hybride fai- 
blement avec des sequences de nucleotides de la region 
de HIV-1. 

30 autre retrovirus denomme SIV-l/ cette 

denomination remplagant la denomination anterieurement 
connue STLV III,, a ete isole chez le singe macaque 
rhesus. (M.D.Daniel et al. Science 228, 1201 (1985) 
N.L.Letwin et al, Science 230, 71 (1985) sous I'appel- 

35 lation "STLV-IIImac*'). 
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Un autre retrovirus, designe " STLV-III^^j^" , 

(ou SIV^^^J a ete isole chez des singes verts sauvages. 
AGM 

Mais, contrairement au virus present chez le singe 
macaque rhesus, la presence de "STLV-III^q^" ne semble 
pas induire une maladie du type SIDA chez le singe vert 
d' Afrique. 

Une souche du retrovirus SlV-imac a ete 
deposee a la CNCM le 7 Fevrier 1986 sous le n* 1-521. 
Des etudes ont montre que le retrovirus SIV-1 comporte 
certaines proteines possedant une certaine parente 
immunologique avec des proteines ou glycoproteines 
structurales susceptibles d'etre obtenues dans des con- 
ditions analogues, a partir de HIV-2. Ce retrovirus 
SIV-1, dont on a constate le caractere infectieux chez 
les singes, avait ete designe par STLVIII par les cher- 
cheurs qui I'ont isole (references bibliographiques 
precitees) . 

Pour la commodite du langage, ces virus ne 
seront plus designes dans ce qui suit que par i' ex- 
pression SIV (1' expression SIV est 1 • abreviation 
anglaise de -Simian Immunodeficiency Virus" (virus 
d • immunodef icience du singe)) eventuellement suivi d'une 
abreviation designant I'espece de singe dont ils sont 
issus, par exetnple, MAC (ou mac) pour le macaque ou AGM 
pour le singe vert d' Afrique (abreviation de "African 

Green Monkey"). 

En mettant en oeuvre les mSmes techniques que 
celles rappelees plus haut, il a ete constate que I'on 
pouvait 6galement obtenir a partir de SIV-lmac : 

- une proteine principale du noyau p27, ayant un poids 
moleculaire de I'ordre de 27 kilodaltons, 

- une glycoproteine majeure d'enveloppe, gp140, 

- une proteine vraisemblablement transmembranaire p32, 
qui n'est guere observee en RIPA lorsque le virus a au 
prealable ete marque par la ^^S-cysteine, mais qui peut 
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etre observee dans les essais d ' inuaunoempreintes 
(Western blots), sous forme de bandes larges. 

. Des etudes plus precises ont ete realisees en 
ce qui concerne les precedents virus HIV-2 et SIV, La 
poursuite de 1* etude des retrovirus HIV-2 a egalement 
conduit, k I'obtention de sequences d'ADN complementaires 
(ADNc) des ARNs de leurs genomes. La sequence nucleoti- 
dique complete de I'ADNc d'un retrovirus representatif 
de la classe HIV-2 (HIV-2 ROD) a ete deposee le 21/02/- 
1986 a la CNCM sous le n* 1-522, sous le nom de refe- 
rence LAV-ir ROD) . 

Gette sequence nucleotidique et les phases de 
lecture ouverte qu'elle. contient sont indiques a la fi- 
gure 1 A. 

En outre r la poursuite de 1' etude d'autres re- 
trovirus a. egalement permis d*aboutir a I'obtention de 
leurs sequences nucleotidiques completes. II en est en 
particulier ainsi de I'ADNc derive de I'ARN genomique de 
SIV.. 

Le clonage et. le sequengage du virus SIV-1mac 
qui ont permis 1 ' obtention de sa sequence nucleotidique 
ont ete realises dans les conditions suivantes : 

L'ADN de cellules HUT 78 infectees par le vi- 
rus SIV (isolat STLV-lil mac 142-83 decrit par Daniel et 
al, (1985) Science, 228 > p. 1201-1204, digere partielle- 
ment par 1 ' enzyme de restriction Sau3A a ete clone au 
site BamHI du bacteriophage vecteur Lambda ELBL3 pour 
constituer une banque genomique* Les 2 millions de pha- 
ges recombinants de la banque genomique ainsi constitute 
ont ete cribles in situ en conditions de securite P3, a 
I'aide de sequences du virus HIV2 provenant des clones 
lambda-R0D4, lambda-ROD35 et E2 (Clavel et al. (1986- 
Nature, 324 / p. 691.) et nick-trans latees. 

L • hybridation a ete realisee en 5xSSC a 50*C 
et les lavages en 2xSSC a 50'C. Un seul clone contenant 
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1' ensemble des sequences virales a ete obtenu, Ce clone 
est designe par lambda-SIV-l . L'inserat du phage lambda- 
SIV-1 mesure 16,5 kb au total et comprend un provirus 
integre auquel manquent seulement les 250 premieres ba- 
ses du LTR gauche, alors que le LTR droit est complet. 

Le provirus integre a ete sequence par la m6- 
thode des dideoxynucleotides apres sous-clonage de frag- 
ments aleatoires dans le phage M13mp8. 300 sous-clones 
ont ete analyses. 

Des fragments d'ADNc provenant du clone Lambda 
SIV-1 inseres dans des plasmides pSIV-1.1 et pSIV-1.2 
ont ete deposes a la CNCM le 15 Avril 1987, sous les 
numeros 1-658 (pSIV-1.1) et 1-659 (pSIV-1.2)- 

Les resultats ont ete mentionnes dans les fi- 
gures decrites ci-apres. 

La figure IB represente la sequence nucleo- 
tidique du, genome viral de SIV et les sequences qui en 
sont deduites pour les proteines virales correspondant 
aux produits des genes gag, pol, env, Q, X, R, tat, art, 
F. 

Les figures 3 a 11 et la figure 1C repre- 
sentent les comparaisons des produits theoriques des 
genes viraux et des LTR entfe HIV2 et SIVmac. (XSIV-1). 

L' invention concerne de plus les fragments 
d'ADNc deduits de l*ADNc issu du genome entier de SIV-1, 
ces fragments contenant une ou plusieurs sequences is- 
sues de la sequence complete d'ADNc et qui codent pour 
des peptides interessants de 1' invention. Ces sequences 
sont indiquees a la figure IB et, a la figure 1C pour ce 
qui a trait a la sequence LTR du virus, 

Les sequences nucleiques de I'ADNc de SIV ont 
ete plac^es en correspondance avec les sequences nu- 
cleiques du virus HIV-2 ROD pour ce qui concerne la se- 
quence LTR (figure 1C) . Cette presentation que I'on re- 
trouve pour le genome entier en rapprochant la figure IB 
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' 8 
des figures 3 a 11 permet de reperer ou de deduire les 
acides nucleiques ayant des elements de structure essen- 
tiels communs aux deux virus . 

L'invention concerne naturellement aussi I'u- 
tilisation des cADNs issus de SIV ou de leurs fragments 
(ou de recombinants les contenant) en tant que sondes, 
pour le diagnostic de la presence ou non de virus HIV-2 
dans des §chantillons de serums ou d'autres liquides ou 
tissus biologiques obtenus a partir de patients 
suspectes d'etre porteiirs du virus HIV-2, Ces sondes 
sont de preference marquees egalement (marqueurs . 
radio-actif s, enzymatiques , f luorescents, etc.). Des 
sondes particulierement interessantes pour la mise en 
oeuvre du procede de diagnostic dii virus HIV-2 ou d*un 
variant de HIV-2 peuvent et're caracterisees en ce 
qii'elles comp'rennent la totalite ou une fraction de 
l*ADNc complementaire du genome du virus SIV ou encore 
notamment les fragments, recombinants contenus dans 
divers clones • * - 

Les sondes mises en oeuvre dans ce procede de 
diagnostic dxi virus HIV-2 et dans les kits de diagnostic 
ne sont en aucune fa?;on reduites aux sondes decrites 
precedemment. Elles comprennent au contraire toutes les 
sequences nucl^otidiques issues du genome du virus SIV, 
d*un variant de SIV ou d'un virus proche par sa structu- 
re, des lors qu* elles permettent la detection dans des 
fluides biologiques de personnes susceptibles de 
developper un SIDA, d'anticorps diriges contre un HIV-2 
ou d*un virus qui en est proche ^ 

La detection peut etre realises de toutes 
faqrons en soi connues. Elle peut comprendre une mise en 
contact de ces sondes soit avec les acides nucleiques 
obtenus a partir des cellules contenues dans ces serums 
ou autres milieux biologiques, par exemple liquides 
cephalo-rachidiens, salives, etc... Elle peut aussi 
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comprendre une mise en contact de ces sondes avec ces 
milieux eux-memes des lors que ieurs acides nucleiques 
ont ete rendus accessibles a 1 ' hybridation avec ces 
sondes, et ce dans des conditions permettant 1* hybri- 
dation entre ces sondes et ces acides nucleiques. L*e- 
tape finale du diagnostic in vitro comprend alors la 
detection de 1 ' hybridation eventuellement produite. Le 
susdit diagnostic mettant en jeu des reactions d' hy- 
bridation peut egalement &tre realise 4 I'aide de me- 
langes de sondes respectivement originaires d'un HIV-2 
et d'un SIV-1 ou d'un HIV-1, d'un HIV-2 et d'un SIV, des 
lors qu'il n'est pas n^cessaire de faire une difference 
entre le type de virus recherche. 

D'une fa9Qn generale, le precede de diagnostic 
de la presence ou non du virus HIV-2 ou d*un variant 
dans des echantillons de serums ou d'autres liquides ou 
tissus obtenus a partir de patients suspectes d'etre 
porteurs du virus HIV-2 comprend les etapes suivantes : 

1/ au moins une etape d ' hybridation conduite 
dans des conditions stringentes, par mise en contact de 
I'ADN de cellules de 1 ' echantillon du patient suspect 
avec I'une des susdites sondes marquees sur une membrane 
appropriee, 

2/ le lavage- de ladite membrane avec une so- 
lution assurant la conservation de ces conditions strin- 
gentes del' hybridation , 

3/ la detection de la presence ou non du virus 
HIV-2 par une methode d ' immunodetection . 

Dans un autre mode de realisation prefere du 
procede selon 1 ' invention 1 ' hybridation precitee est 
conduite dans des conditions non stringentes et le la- 
vage de la membrane est realise dans des conditions 
adaptees a celles de 1 ' hybridation. 

II va de soi que 1 ' invention concerne les 
2g acides nucleiques correspondant a des sequences placees 



20 



25 



30 



WO88/05440 



PCr/FR88/00025 



10 



10 - 

en des regions analogues de variants de SIV ainsi que 
tous les acides nucleiques dont les modifications re- 
sulteraient de la mis.e a profit de la degenerescence du 
code genetique- 

Les etudes comparatives qui ont aussi permis 
d'aboutir a des resultats relatifs aux proteines de 
noyau (core), ci-apres denommees "proteines cracr " et aux 
proteines . d ' enveloppe^ , ci-apres- denommees "proteines 
env" , ont egalement ete rapportes dans la demande de 
brevet etiropeen n* 87/400.151,4, deja citee. Ces re- 
sultats montreni: que les proteines du noyau (proteines 
gag ) dans HIV-2 presentent des differences moins ac- 
centuees par rapport a celles des virus HIV-1, que les 
proteines d'enveloppe (proteines env) . Globalement les 
15 proteines env .dans HIV-2 se sont revelees presenter des 
* parentes immunologiques extremement faibles, sinon 
inexistentes, avec-les proteines env correspondantes des 
virus HIV- 1 . . . 

Au . contraire des etudes comparatives ef f ec-. 
2Q tuees entre les structures des sequences d'ADNc des vi- 
rus HiV-2 et SIV permettent de mettre en evidence cer- 
taines caracteristiques communes qui apparaissent au 
niveau des proteines/ 

Globalement^ les proteines de H1V^2 et de 
25 SIV-1 montrent des parentes immunologiques importantes. 

La grlycoproteine majeure d'enveloppe de HIV-2 
s'est r^vdlee etre plus proche immunologiquement de la 
glypoproteine majeure d'enveloppe de SIV que de la gly- 
coproteins majeure d'enveloppe de HIV-1 . 
3Q Ces constatations s'imposent non seulement au 

niveau des poids mpleculaires : 130-140 kilodaltons pour 
. les glycoproteines majeures de HIV-2 et de SIV contre 
environ 110 pour la glycoproteine majeure d ' enveloppe. de 
HIV-1, mais aussi au niveau des proprietes immunolpgi- 
25 ques, puisque des serums preleves a partir de malades 
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infectes par HIV-2, et plus particulierement des anti- 
corps formes contre la gp140 de HIV-2 reconnaissent la 
gp140 de SlV-lmaCi alors que dans des essais semblables 
les memes serums et les memes anticorps de HIV-2 ne 
reconnaissent pas la gp110 de HIV-1. Mais les serums 

anti-HIV-1 qui n'ont jamais reagi avec la gp140 de HIV-2 

35 

precipitent une proteine de 26 Kdal marquee par la S- 
cysteine, contenue dans les extraits de HIV-2. 

La proteine majeure du noyau (core) de HIV-2 
semble presenter un poids moleculaire moyen (environ 
26.000) intermediaire entre celui de la p25 de HIV-1 et 
la p27 de SIV. 

Ces observations resultent des essais realises 
avec des extraits viraux obtenus a partir du HIV-2 isole 
a partir de I'un des patients susmentionnes . Des re- 
sultats similaires ont ete obtenus avec des extraits vi- 
raux du HIV-2 isole a partir du second patient, 

Des etudes plus poussees ont conduit les in- 
venteurs a reconnaitre une premiere classe de peptides 
ayant des sequences d'aminoacides soit identiques, soit 
proches de sequences contenues a I'interieur des stru- 
ctures des proteines gag et env de HIV-2 ou de SIV voire , 
de HIV-1. Ces peptides sont notamment applicables au 
diagnostic djune infection chez I'homme par le virus 
HIV-2 ou de I'un de ses variants, 

A cet 4gard la presente invention concerne 
egalement des precedes et des compositions de diagnostic 
pour la detection in vitro d* anticorps diriges contre un 
virus Hiy-2 ou de ses variants, plus particulierement 
dans des echantillons biologiques, notamment des serums 
de patients ayant subi une infection par le virus HIV-2, 
certains de ces peptides permettant une discrimination 
particulierement poussee entre les infections dues a des 
virus HIV-2 et a des virus HIV-1. 

Ces etudes poussees ont egalement conduit a la 
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possibilite de synthetiser des peptides inmuno genes qu 
susceptibles d'etre rendus immunogenes , presentant des 
caracteris.tiqiies de structures leur permettant d'induire 
in vivo la production d'anticorps susceptibles de re- 
connaitre des proteines env a la fois dans HIV-1 et dans 
HIV-2 et, au moins pour certains de ces peptides, de se 
fixer tant sur des virus HIV-1 que sur des virus HIV-2, 
plus . particuliereinent aux fins de les neutraliser. 
L* utilisation de ces derniers types de peptides est done 
particulierement indiquee pour la production de princi- 
pes actif s de vaccins contre les virus HIV, done contre 
le SIDA. 

Pour designer ci-apres les residus d'amino^ 
acides entrant dans la constitution des peptides selon 
1^ invention, ' on aura recours, pour ceux des acides ami- 
nes ayant une signification univoque a la nomenclature- 
internationale designant chaque acide amine naturel par 
unef lettre unique (lettre majuscule) selon le tableau 
des correspondances qui suit : 



35 



M 


Methionine 


L 


Leucine 


I 


Isoleucine 


V 


Valine 


^ 


Phenylalanine 


S 


Serine 


P 


Proline 


T 


Threonine 


A 


Alanine 


y 


Tyrosine 


H 


Histidine 


Q 


Glutamine 


N 


Asparagine 




Lysine 


D 


Acide Aspartique 


iE 


Acide glutaminique 
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C Cysteine 
W Tryptophane 
R Arginine 
G Glycine 

Lorsqu*un acide amine pourra, en raison de sa 
position au sein de la chaine d * aminoacides caracte- 
ristique d'un peptide determine, prendre plusieurs si^ 
gnif ications, il pourra soit etre designe par un tiret 
si sat signification peut etre quelconque, soit par 
une lettre minuscule lorsque cet aminoacide pourra 
presenter un nombre limite de significations preferees, 
ce nombre etant cependant tou jours superieur a 1 . Dans 
ce dernier cas, les significations possibles de cette 
lettre minuscule seront toujours precisees en rapport 
avec le peptide auquel il appartient, 

Afin de faciliter la lecture, ces peptides 
seront designes par une abreviation env ou gag suivie 
d*un indice numerique, par reference a des sequences 
d' aminoacides contenues, selon - le cas, soit dans les 
proteines env soit dans les proteines aaa de certains 
HIV-1, HIV-2 ou SIV. II y sera encore fait reference 
dans ce qui suit. 

Enfin dans les definitions qui suivent 

- les groupes X represent ent soit un groupe NHj libre ou 
amide, notamment par un ou deux groupes alcoyle com- 
prenant de 1 a 5 atomes de carbone, soit un groupe pep- 
tidique comprenant de 1 i 5 aminoacides, dont 1* amino- 
acide N-terminal presente lui-meme un groupe libre 
ou amide comme precedemment indique, et 

- les groupes Z representent, soit un groupe -OH libre 
ou alcoxyle et contenant alors un groupe alcoyle com- 
prenant de 1 a 5 atomes de carbone, soit un groupe pep- 
tidique comprenant de 1 a 5 aminoacides, dont 1' ami- 
noacide C- terminal presente lui-meme un groupe -OH 
libre . ou alcoxyle, comme precedemment indique, les 
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groupes de 1 a 5 acides amines le cas echeant contenus 
dans .X ou Z ou dans les deux a la fois etant.tels, que 
leur presence n'est pas incompatible avec la preserva- 
tion pour I'essentiel des proprietes immunologiques , le 
cas echeant immunogdnes^ des peptides qui en sent de- 
pourvus.. 

Les peptides selon 1' invention, qui exit en 
commun des proprietes immunologiques avec des antigenes 
de HIV-2 etr pour certains d'entre eux egalement avec 
des antigenes de mv-1 ou de ses variants, sont caracte- 
rises en ce quails ont egaement une structure peptidique 
en commun avec les. antigenes de SIV. De fagon avanta- 
geuse, ces peptides comprennent normalement au plus 40 
residus d' acides amines. 

Des" peptides preferes sont les suivants : 
envl . . 

XRV-AXEKYL-DQA-LN-WGCAFRQVCZ 
env2 

X-LE-AQt-QQEKNMYELQKLNZ 
env3 

XELGDYKLVEITPIG-APT~KR Z 

env4 

X VTV-YGVP-WK-AT^-LPCA-Z 

envS 

X—QEr— L-NVTE-F—W-riZ 
env6 

XL S-KPCVKLTPLCV~Z 

erivT 

env8 

X-I—YC-P-G-A-L-C-N-TZ 
env9 

X — A-C r— W— Z 

envIO 

35 X-G-DPE— NC-GEF-YCN NZ 
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env1 1 

X C-IKQ-I G— -YZ 

Plus particulierement 1 ' invention concerne les 
peptides suivants : 

f 

5 envl 

XRV-AIEKYL-DQA-LN-WGCAFRQVCZ 

env2 

X-LE-AQIQQEKNMYELQKLNZ 
env3 

XELGDYKLVEITPIG-APT--KR Z 

env4 

X VTV-YGVP-W~AT — LFCA-Z 

env5 

X E — L-NVTE-F — W-NZ 

-J 5 env6 

XL S-KPCVKL-PLC^ Z 

env7 

X N-S-I C-K Z 

env8 

2Q X-I— YC-P-G-A-L-C-N-TZ 
env9 

X A-C W~Z 

envIO 

X-G-DPE NC-GEF-YC NZ 

25 envll 

X C-I-Q-I G YZ 

Des peptides avantageux correspondant aux pre- 
cMents, prSsentent les formulas qui suivent : 
jgnvl 

3Q XRVTAIEKYLQDQARLNSWGCAFRQVCZ , ou 
XRVTAI EKYLKDQAQLNAWGCAFRQVCZ 
env2 

XSLEQAQIQQEKNMYELQKLNSWZ , OU 
XLLEEAQIQQEKNMYELQKLNSWZ 
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XELGQYKLVEITPIGFAPTKEKRYSSAHZ , OU 
XELGDYKLVEITPIGLAPTNVKRYTTG-Z 

(Or "remarquera que les peptides env1 . env2 > env3 
attestent de la tres grande parente entre HIV-2 et 
SIV-1. En effet le premier peptide est inclu dans le 
genome de HIV-2 et le second, dans celui de SIV-1) , 
env4 

Xa&cdVTVeYGVPfWogAThiLFCAjZ ^ * . . 

dans lesquels les lettxes de a 4 j peuvent avoir les 

significations suivantes : 

a est C, E OU D 

b est Tr K, D, H on 1 

c es:t Q OU L 

d est Y OU W ' 

e est F OU Y 

f est T, V OU A ^ 
g esj:. N ou E ' 
h est I ou T • . 
i est P OU T 
j est T OU S 

0 est K OU R 
env5 

.XahcoEdeLf NVTEgFhiW jNZ , 

dans lequel les lettres de a a j peuvent avoir les 

significations siiivantes r 

a est D ou P 

b est D OU N; 

c est Y OU P 

d est I, Vr I OU L 

e est T, V, E OU A 

f est V, G OU E OU ^ 

g est A, N, G OU S 

h est D OU N 

1 est A OU M 
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j est N, K ou E 
o est Q ou S 
env6 

XLabcSdKPCVKLoPLCuef KZ , 
g dans lequel les lettres de a a f peuvent avoir les 
significations suivantes : 
a est F ou W 
b est E ou D 
c est T ou Q 
d est I ou L 
e est A, S ou T , 
f est M ou L 
o est T ou S 
u est V ou I 



XabCNxSylocdCeKf ghiZ , 

dans lequel les lettres de a a i et x et y peuvent avoir 
les significations suivantes : 



20 



25 



30 



a 


est 


N 


ou 


T ou 


b 


est 


H 


ou 


S ou 


c 


est 


E 


ou 


Q 


d 


est 


s, 


A 


ou C 


e. 


est 


D 


ou 


p 


f 


est 


H/ 


V 


ou D 


g 


est 


Y 


ou 


S 


h 


est 


W 


ou 


F 


i 


est 


D 


ou 


E 


X 


est 


T 


ou 


R ^ 


y 


est 


V 


ou 


A 


o 


est 


T 


ou 


Q 


envS 









XalbcdYCxPeGf AgLhCiN jTZ , 

dans lequel les lettres de a a k et x peuvent avoir les 
significations suivantes : 



35 
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a 


est 


A 


ou 


p." 


b 


es"t 


R 


ou 


p 


c 


est' 




I 


ou C 


d 


est 


R. 


ou 


H 


e 


est 


P 


ou 


A 


f 


est 


y 


ou. 


F , 


g 


est 


T ■ 


cu 


I 


h 


est 


R 


ou 


K 


i 


est 




ou 


N 


j 


est 


D 


ou 


K 


X 


est 


A 


ou 


T 



en.v9 

XwabcxyAdCef ghizW jkZ , 

dans lequel les lettres de a a k et x. a z peuvent avoir 
les significations suivantes : 



20 
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a 


est 


K 


bu 




ou 


E 






b 


est 


R 


ou 












c 


est 


P 


du 


M 


ou 


I 






d 


est 


W 


ou 


E 


ou 


Y 






e 


est 


W 


pu 


N 


ou 


T 


ou 


R 


f 


est 


F. 


ou 


I 










g 


est 


K 


ou 


S 


ou 


N 


ou 


G 


h 


est 


G 


ou 


R 


ou 


£ 






i 


est 




ou 


A 


QU 


T 






♦ 


est 


K 


ou 


N 


du 


D 


ou 


S 


k 


est 


D 


ou 


A 


ou 


N 


ou 


K 


w 


est 


N, 


D 


ou i 








X 


est 


R 


ou 


G 


ou 


K 






y 


est 


Q 


ou 


K 


ou 


R 






z 


est 


K 


ou 


E 


ou 


Q 


ou 


N 



env10 

XaGbDPEcdef ghNCiGEF j YCokxlmnNZ , 

dans lequel les lettres de a a n et x peuvent avoir les 
significations suivantes : 
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a 


est 


K 


ou 


- 


ou 


G 


b 


est 


S 


ou 


G 


ou 


- 


c 


est 


V 


ou 


I 






d 


est 


A 


ou 


V 


ou 


T 


e 


est 


Y 


ou 


T 


ou 


M 


f 


est 


M 


ou 


H 






g 


est 


W 


ou 


s 






h 


est 


T 


ou 


F 






i 


est 


R 


ou 


G 






3 


est 


L 


ou 


F 






o 


est 


N 


ou 


K 






k 


est 


M 


ou 


S 






1 


est 


W 


ou 


Q 


ou 


K 


m 


est 


F 


ou 


L 






n 


est 


L 


ou 


F 






X 


est 


T 


ou 


S 


ou 


N 


env1 1 













XabcdwCeloQf IxgyhizG jklYZ , 

dans lequel les lettres de a a 1 et w a z peuvent avoir 
les significations suivantes : 



35 



a 


est 


R 


OU 


T 


b 


est 


N 


OU 


I 


c 


est 


Y 


ou 


T 


d 


est 


A 


ou 


L 




est 


H 


ou 


R 


£ 


est 


I 


ou 


F 


g 


est 


T 


ou 


M 


h 


est 


H 


ou 


Q 


i 


est 


K 


ou 


E 


j 


est 


R 


ou 


R 


k 


est 


N 


ou 


A 


1 


est 


V 


ou 


M 


w 


est 


P 


ou 


Q 


X 


est 


N 


ou 


K 


y 


est 


W 


ou 


V 
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z est V ou T ou K 
o est K ou R 

La structure du peptide antigenique code par 
le gene gag et designe par gag l est egalement represen- 
tee ci-apres : 
XDCKLVLKGLGaNPTLEEMLTAZ , 
dans lequel ia iettre a designe M ou T. 

II sera remarque que, d'une fagon generale, 
les aminoacides ayant une signification univoque (done 
repr^sentes par une lettre majuscule correspondant a la 
nomenclature internationale) qui interviennent dans les 
definitions qui precedent des peptides selon 1' inven- 
tion, se trouvent etre la correspondance avec des amino- 
acides identiques places dans le meme ordre dans les se- 
quences env du gag correspondantes de la proteine env ou 
gag d'au moins I'un des HIV, ou de SIV-1. 

Les positions de ces sequences sont soulignees 
et reperees au sein des sequences d* aminoacides des 
proteines env respectivement de HIV-2 ROD (CNCM n* 
1-532) et HIV-1 BRU (CNCM n* 1-232) representees a la 
figure 2. Par ailleurs, les alignements des acides ami- 
nes des proteines env et gag respectivement de SIV-1mac 
(CNCM n* 1-521) et de HIV-2 ROD sont presentees a la 
figure 3 et ^ la figure 4. 

Les traits pleins qui apparaissent en certai- 
hes localisations de ces sequences visent a souligner 
que certains aminoacides contenus dans ces sequences ont 
ete volontairement deletes au plan de la presentation, 
afin de permettre la mise en alignement d ' aminoacides 
respectivement identiques (alors marques d"un aste^ 
risque) ou de deux points verticaux sur une mSme ligne 
verticale dans les sequences des proteines correspon- 
dantes de HIV-1 et de HIV-2 d'une part, de SIV et de 
HIV-2 d' autre part. 
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Outre les peptides precites, 1' invention con- 
cerne egalement les peptides modifies par insertion 
et/ou deletion et/ou substitution d'un ou plusieurs 
acides amines, pour autant que les proprietes antige- 
niques ou immunogenes desdits peptides ne sont pas mo- 
difiees, ou que les proprietes de reconnaissance de 
I'antigene ou de I'anticorps avec lesdits peptides ne 
sont pas substantiellement modifiees, 

Dans un mode de realisation particulierement 
prefere, 1' invention concerne des peptides ayant des 
proprietes immunologiques en commun avec I'ossature 
peptidique de la glycoproteine d'enveloppe des virus de 
la classe HIV-2, ces peptides contenant un nombre de 
residus d* acides amines n'excedant pas 40. 

Ces peptides preferes selon 1' invention ont 
les sequences suivantes : 
env1 

RVTAIEKYLQDQARLNSWGCAFRQVC ' 

AIEKYLQDQ 
RVSAIEKYLKDQAQLNAWGCAFRQVC 

AIEKYLKDQ 
env2 

SLEQAQIQQEKNMYELQKLNSW 

QIQQEKN 
LLEEAQIQQEKNMYELQKLNSW 
env3 

ELGDYKLVEITPIGFAPTKEKRYSSAH 

YKLVEITPIGFAPTKEK 
ELGDYKLVEITPIGLAPTNVKRYTTG- 

YKLVEITPIGLAPTNVK 

env4 

CTQ YVTVF YGVPTWKNAT I PLFC AT 

VTVFYGVPTWKNAT 
CIQYVTVFYGVPAWRNATIPLFCAT 

VTVFYGVPAWRNAT 
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EKLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
EDLWVTVYYGVPVWKEATTTLFCAS - 

VTVYYGVPVWKEAT 
DNLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 

env5 

DDYQEITL-NVTEAEDAWNN 

L-NVTEAF 
DDYSELAL-NVTESFDAWEN 

L-NVTESF 
PNPQEWLVNVTENFNMWKN 

LVNVTENF 
PNPQEIELENVTEGFNMWKN 

LENVTSGF 
PNPQEIALENVTENFNMWKN 

LENVTENF 

ETS IKPCVKLTPLCVAMK 
ETSIKPCVKLSPLCITMR 
DQSLKPCVKLTPLCVSLK 
DQSLKPCVKLTPLCVTLN. . 
PCVKLTPLCV 

env7 

NHCNTSVITESCD 

NTSVIT 
NHCNTSVIQECCD 

NTSVIQ 
TSCNTSVITQAGP 

NTSVIT 
INCNTSVITQACP 

NTSVIT 
INCNTSAITQAGP 

NTSAIT 



35 
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env8 

YCAPPGYALLRC-NDT 
yCAPAGFAILKCNNKT. 
YCAPAGFAILKCNDKK 
g yCAPAGFAILKCRDKK 
env9 

NKRPRQAWCWFKG -KWKD 
NERPKQAWCRFGG-NWKE 
N— MRQAHCNI SRAKWNA 
D— IRRAYCTINETEWDK 

10 

I— IGQAHCNISRAQWSK 

KGSDPEVAYMWTNCRGEFLYCNMTWFLN 

NCRGEFLYCN 
GG-DPEVTFMWTNCRGEFLYCKMNWFLN 
^ NCRGEFLYCK 

-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN 
-GGDPEITTHSFNCRGEFFYCNTSKLFN 

NCRGEFFYCN 

20 

-GGDPEITTHSFNCGGEFFYCNTSGLFN 
NCGGEFFYCN 

envl 1 

RNYAPCHIKQIINTWHKVGRNVY 
22 CHIKQII 

RNYVPCHIRQIINTWHKVGKNVY 

CHIRQII 
TITLPCRIKQFINMWQEVGKAMY 

CRIKQFI 
SITLPCRIKQIINMWQKTCKAMY 

30 

CRIKQII 
NITLQCRIKQIIKMVAGR-KAIY 
CRIKQII 

DCKLVLKGLGTNPTLEEMLTA 
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Les peptides selon 1 * invention peuvent encore 
avantageusement etre prepares par les techniques clas- 
siques, dans le domaine de la synthese des peptides. 
Cette synthese peut etre realisee en solution homogene 
2 ou en phase solide. 

Par exemple^ on aura recours a la technique de 
synthese en solution homogene decrit par HOUBENWEYL dans 
I'ouvrage intitule ''Methode der Organischen Chemie" 
(Methode de la Chimie Organique) edite par E. Wunsch, 

-IQ vol. 15-1 et II., THIEME, Stuttgart 1974. 

Cette methode de synthese consiste a condenser 
success ivement deux-a-deux les aminoacyles successifs 
dans I'ordre requis, ou a condenser des aminoacyles et 
des fragments prealablement formes et contenant deja 

15 plusieurs aminoacyles dans I'ordre appropri^, ou encore 
plusieurs fragments prealablement ainsi prepares, etant 
entendu que I'on aura eu sqin de proteger au prealable 
toutes les fonctipns reactives portees par ces amino- 
acyles ou fragments', a 1' exception des fonctions amines 

2Q de l^un et car boxy les de 1* autre ou vice- versa, qui 
doivent normalement intervenir dans la formation des 
liaisons peptidiques, notamment apres activation de la 
fonction carboxyle, selon les methodes bien connues dans 
la synthese des peptides. En variante, on pourra avoir 

25 recours i des reactions de coiipiage mettant en jeu des 
reactifs de couplage classique, du type carbodiimide, 
tels que par exemple la 1-ethyl-3-(3-dimethyl-amino- 
propyl) -carbodiimide. Lorsque I'aminoacyle mis en oeuvre 
possede une fonction acide supplementaire (notamment 

2Q dans le cas de 1' acide glutamique) , ces fonctions seront 
par exemple protegees, par des groupes t-bustylester . 

Dans le cas de la synthese progressive, acide 
amine par acide amine, la synthese debute de preference 
par la condensation de 1 " amino-acide C-terminal avec 

25 I'aminoacide qui correspond a I'aminoacyle voisin dans 
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la sequence desiree et ainsi de suite, de proche en 
proche, jusqu'a I'acide amine N-terminal. Selon une 
autre technique preferee de 1* invention, on a recours a 
celle decrite par R.D. MERRIFIELD dans 1* article 
intitule "Solid phase peptide synthesis" (J. Am. Soc, , 
45, 2149-2154). 

Pour fabriquer une chaine peptidique selon le 
procede de MERRIFIELD, on a recours a une resine polyme- 
re tres poreuse, sur laquelle on fixe le premier acide 
amine C-terminal de la chaine. Cet acide amine est fixe 
sur la resine par 1 • intermediaire de son groupe 
carboxylique et sa fonction amine est protegee, par 
exemple par le groupe t-butyloxycarbonyle. 

Lorsque le premier acide amine C-terminal est 
ainsi fixe sur la resine, on enleve le groupe protecteur 
de la fonction amine en lavant la resine avec un acide. 

Dans le cas ou le groupe protecteur de la 
fonction amine est le groupe t-butyloxycarbonyle, il 
peut etre elimine par traitement de la resine a l.'aide 
d' acide trif luoroacetique . 

On couple ensuite le deuxieme acide amine qui 
fournit le second amino-acyle de la sequence recherche, 
a partir du residu amino-acyle C-terminal sur la fonc- 
tion amine deproteg^e du premier acide amine C-terminal 
fixe sur la chaine. De pef6rence, la fonction carboxyle 
de ce deuxiejne acide amine est activee, par exemple par 
la dicyclohexylcarbodiimide, et la fonction amine est 
protegee, par exemple par le t-butyloxycarbonyle. 

On obtient ainsi la premiere partie de la 
chaine peptidique recherchee, qui comporte deux acide 
amines, et dont la fonction amine terminale est 
protegee. Comme precedemment, on deprotege la fonction 
amine et on peut ensuite proceder a la fixation du 
troisieme aminoacyle, dans les conditions analogues d 
celles de 1* addition du deuxieme acide amine C-terminal. 
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On fixe ainsi, les uns apres les autres, les 
acides amines qui vont constituer la chaine peptidique 
sur le groupe amine chaque f ois deprotege au prealable 
de la portion de la chaine peptidique deja formee, et 
qui est rattachee a la resine. 

Lorsque la totalite de la chaine peptidique 
desiree est ' formee, on elimine les groupes protecteurs 
des differents acide amines constituant la chaine pepti- 
dique et on detache le peptide de la resine par exemple 
a I'aide d* acide f luorydrique • 

L' invention concerne egalement les oligomer es 
hydrosolubles des peptides monomeres sus-indiques . 
L ' oligomerisation peut provoquer un accroissement de 
1 ' immunogenicite des peptides monomeres selon 1 * inven- 
tion. Sans qu'une telle indication chiffree puise etre 
consider ee comme limitative r on mentionnera neanmoins 
que ces oligomer's peuvent, par exemple, contenir de 2 a 
10 unites monomeres. 

Les unites monomeres entrant dans cet oligo- 
mere sont sbit toutes constitutes par le polypeptide de 
sequence 1 ou par le polypeptide de sequence 2r soit par 
1 ' un et 1 • autre de ces polypeptides . 

On peut avoir recours/ pour realiser 1' oligo- 
merisation, a toute technique de polymerisation couram- 
ment utilisee dans le domaine des peptides, cette poly- 
merisation etant conduite jusqu'd I'obtention d'un oli- 
gomere ou polymere contenant le nombre de motifs mono- 
meres requis pour 1* acquisition de 1 ' immunogenicite 
desiree, 

Une methode d' oligomerisation ou de polyme- 
risation du monomere consiste dans la reaction de 
celui-ci avec un agent de reticulation tel que le glu- 
taraldehyde . 

On peut egalement avoir recours a d * autres me- 
thodes d*" oligomerisation ou de couplage, par exemple a 
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celle mettant en jeu des couplages successifs d' unites 
monomeresr par 1 ' intermediaire de leurs fonctions ter- 
minales carboxyle et amine en presence d' agents de cou- 
plage homo- ou hetero- bif onctionnels . 

On peut egalement pour la production de mole- 
cules coiaportant un ou plusieurs motifs de 17 acides 
amines tels que definis ci-dessus, avoir recours a des 
techniques du genie genetique mettant en oeuvre des 
micro-organismes transformes par un acide nucleique 
determine comprenant des sequences nucleotidiques ap- 
propriees correspondantes . 

L' invention concerne egalement les acides nu- 
cleiques contenant une ou plusieurs sequences issues de 
la sequence de I'ADNc du virus HIV-2 ROD. Ces sequences 
reperees par* la numerotation figurant sur la sequence 
precedemment decrite, codent pour certains peptides 
interessants de 1* invention. 
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Sequence 


codant pour 


env1 


nucleotides 


7850 


a 


7927 


n 


II 


env2 


n 


8030. 


a 


8095 


It 




env3 


II 


7601 


a 


7636 


II 


It 


env4 


II 


6170 


a 


6247 


II 


n 


env5 


11 


6294 


a 


6349 


» 


Iff 


env6 


n 


6392 


a 


6445 


u 


It 


env7 


It 


6724 


k 


6763 


M 


It 


env8 


M 


6794 


a 


6838 


l> 


n 


env9 


n 


7112 




7162 




n 


env10 


It 


7253 


a 


7336 


n 


II 


env1 1 


II 


7358 




7426 


u 


n 


qaq.1 


II 


1535 


k 


1597 




L* invention concerne enfin les 


acides nu- 



cleiques correspondants du virus SIV, contenant une ou 
plusieurs sequences issues de I'ADNc du virus SIV-1. Ces 
sequences codant pour les peptides env1 a env1 1 et aaal 
peuvent etre reperes sur la figure 3 par comparaison 
avec les sequences correspondantes decrites pour HIV-2 . 
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II va de spi que 1' invention concerne les 
acides nucleiques correspondaiit a des sequences placees 
en des regions analogues des ADNc derives de variants de 
HIV-2 ROD ou de SIV, ainsi que tous les acides nuclei- 
ques dont les modifications vis a vis des precedents 
resulteraient de la mise a profit de la degenerescence 
du code genetique. 

L' invention concerne encore les conjugues 
obtenus par couplage covalent des peptides selon 1 • in- 
vention (ou des susdits oligomer es) a des molecules por- 
teuses (naturelles ou synthetiques) , physiologiquement 
acceptables et non toxiques , par 1 ' intermediaire de 
groupements reactifs complementaires respectivement por- 
tes par la molecule porteuse et le peptide. Des exemples 
de groupements appropries sont illustres dans ce qui 
suit : 

•A titre d'exeaple de molecules porteuses ou 
supports macromoleculaires entrant dans la constitution 
des conjugues selon 1' invention, on mentionnera .des 
proteines naturelles, telles que I'anatoxine tetanique, 
1 ' o valbulmine , des sertims albumines , des hemocyamines, 
etc . • - 

A titre de support macromoleculaires syntheti- 
ques, on mentionnera par exemple des polylysines ou des 
poly ( D-L-alanine ) -poly ( L-ly sine ) . 

La litterature mentionne d'autres types de 
supports macromoleculaires susceptibles d'etre utilises, 
lesquels presentent en general un poids moleculaire 
superieur a 20 000, 

Pour synthetiser les conjugues selon 
1' invention, on peut avoir recours a des precedes connus 
en soi, tels que celui decrit par FRANTZ et ROBERTSON 
dans Infect,* and Immunity, 31, 193-198 (1981), ou celui 
decrit dans Applied and Environmental Microbiology, 
(octobre 1981), vol. 42, n* 4, 611-614 par P.E. KAUFFMAN 
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en utilisant le peptide et la molecule porteuse appro- 
priee. 

Dans la pratique, on utilisera avanta- 
geusement comme agent de couplage les composes suivants, 
5 cites a titxe non limitatif : aldehyde glutarique, 
chloroformiate d'ethyle, carbodiimides hydrosolubles 
[N-ethyl-N ' ( 3-dimethylamino-propyl ) carbodiimide, HCl] , 
diisocyanates , bis-diazobenzidine, di- et trichloro-s- 
triazines, bromures de cyanogener ainsi que les agents 
de couplage inentionnes dans Scand. J. Immunol., (1978), 
vol. 8, p. 7-23 (AVRAMEAS, TERNYNCK, GUESDON) . . 

On peut avoir recours 4 tout procede de 

couplage faisant intervenir d'une part une ou plusieurs 

fonctions reactives du peptide et d' autre part, une ou 

4c plusieurs fonctions reactives de molecules supports . 
15 

Avantageusement, il s'agit des fonctions carboxyle et 
amine, lesquelles peuvent donner lieu a "une reaction de 
couplage en presence d'un agent de couplage du genre de 
ceux utilises dans la synthese des prot^ines, par 

2Q exemple, le 1-ethyl-3- (3-dimethylaminopropyl)- 

carbodiimide, le N-hydroxybenzotriazole, etc... On peut 
encore avoir recours a la glutaraldehyde, notamment 
lorsqu'il s'agit de relier entre e\ix des groupes amines 
respectivement portes par le peptide et la molecule 

25 support. 

Les peptides selon 1' invention possedent des 
proprietes antigeniques . lis peuvent done etre utilises 
dans des procedes de diagnostic pour la detection d'une 
infection par le virus HIV'-2, 

Comme on I'a deja mentionne, des etudes ont 
permis de distinguer deux groupes cle peptides pouvant 
etre mis en oeuvre dans des procedes de detection d'an- 
ticorps contre le virus HIV-2 dans un fluide biologique 
humain, notamment un s6rum ou un liquide cephalo-ra- 
25 chidien. 
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Un premier groupe (I) comprend les peptides 
gag ^ . Ces peptides reconnaissent des anticorps anti- 
HIV-2 et sont done capables de detecter une infection 
par HIV-2. lis reconnaissent egalement dans une certaine 
mesure des anticorps anti-HIV-1. 

Un second groupe (II) comprend des peptides 
qui correspondent plus particulierement a ceux qui sont 
situes dans la partie transmembranaire et dans la fin de 
la partie externe de la proteine d'enveloppe. Ces pep- 
tides sont ceux precedemment designes par env1 > env2 et 
env3. lis permettent ^la reconnaissance specif ique de la 
presence d 'anticorps centre HIV-2 et permettent done de 
discriminer chez une personne les infections pass^es ou 
presentes dues a un HIV, plus particulierement entre 
celles qui ont ^te provoquees par un HIV-2 et celles qui 
I'ont ete par un HIV-1. 

L* invention concerne egalement une composition 
contenant au moins I'un des susdits peptides ou au moins 
un oligomere de ce peptide, caracterisee en ce qu'elle a 
la capacite d'etre reconnue par des serums d'origine hu- 
maine contenant des ajiticorps centre le virus HIV-2. 

L* invention concerne un precede de diagnostic 
in vitro un ou des peptides selon 1' invention pour la 
detection d" anticorps contre HIV-2 dans des fluides bio- 
25 logiques, en particulier dans des serxms humains. 

D'une fagon generale le precede de diagnostic 
ia vitrq ci-dessus comprend les etapes suivantes : 

la mise en contact de ce liquide biologique 
avec lesdits peptides, 
3Q - la detection de la presence eventuelle d*un 

complexe peptide-anticorps par des methodes physiques ou 
chimiques, dans ledit liquide biologique. 

Dans un mode de realisation prefere de 1' in- 
vention, la detection du complexe antigene-anticorps est 
35 realisee grace a des tests immuneenzymatiques (du type 
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ELISA), immunofluorescents (du type IFA), radioimmunolo- 
giques (du type RIA) ou des tests de radioimmunoprecipi- 
tation (du type RIPA) • 

Ainsi 1 ' invention concerne egalement tout peptide selon 
1' invention marque a I'aide d'un marqueur adequat du 
type enzymatique, fluorescent, radioactif, etc... 

De telles methodes comprennent par exeapie les 

etapes suivantes : 

depot de quantites determinees d'une 
composition peptidique selon 1' invention dans les puits 
d'une microplaque de titration, 

- introduction dans lesdits puits de dilutions 
croissantes du serum devant etre diagnostique, 

- incubation de la microplaque, 

- fingrages repetes de la microplaque, 
introduction dans les puits de la micro- 
plaque d'anticorps marques contre des immunoglobulines 
du sang, le marquage de ces anticprps ayant ete realise 
a I'aide d'une enzyme selectionnee parmi celles qui sont 
capables d'hydrolyser un substrat en modifiant 1' absor- 
ption des radiations de ce dernier, au moins a une lon- 
gueur d'onde determinee, 

- detection, en comparaison avec un t^moin de 
controle, de la quantite de substrat hydrolyse. 

L' invention concerne egalement des cof frets ou 
kits pour le diagnostic in vitro de la presence d' anti- 
corps contre les virus HIV- 2 et, dans certains cas, 
HIV-1 dans un milieu biologique qui comprennent : 

- une composition peptidique selon I'inven- 

30 ^i^^' 

les reactifs pour la constitution du milieu 
propice a la realisation de la reaction immunplogique, 

- les reactifs permettant la detection du com- 
plexe antigenes-anticorps produit par la reaction im- 

35 munologique. De tels reactifs peuvent egalement porter. 
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un marqueux, ou etre susceptibles d'etre reconnus a leur 
tour par un reactif marque. Plus particulierement dans 
le cas ou la composition polypeptidique sus-mentionnee 
n*est pas marquee. 

un tissu fluide biologique de reference de- 
pourvu d'anticorps reconnus par la composition polypep- 
tidique sus-mentionnee, 

L' invention concerne les anticorps eux-memes 
formes contre les peptides de 1' invention. 

II va de soi que cette production n'est pas 
limitee aux anticorps polyclonaux. 

Elle s' applique encore a tout anticorps mono- 
clonal produit par tout hybridome susceptible d'etre 
forme, par des methodes classiques, a partir des cel- 
lules spleniques d'un animal, nbtamment de souris ou de 
rat, immunises contre I'un des peptides de 1' invention, 
d'une part et des cellules d*une lignee de cellule 
myelome approprie d*autre part, et d'etre selectionne, 
par sa capacite a produire des anticorps monoclonaux 
reconnaissant le peptide initialement mis en oeuvre pour 
1 ' immunisation des animaux. 

Ir ' invention concerne egalement des composi- 
tions immunogenes pour la production de vaccins dont le 
principe actif est constitue par au moins un peptide 
selon 1' invention, ou un oligomere de ce peptide, ou un 
peptide sous forme conjuguee avec une molecule porteuse, 
caracterisees en ce qu'elles induisent la production 
d' anticorps contre les susdits peptides en quantite suf- 
f isante pour aussi inhiber les proteines du retrovirus 
HIV-2, voire m§me le retrovirus HIV-2 entrant en asso- 
ciation avec un vehicule pharmaceutiquement acceptable. 

Les compositions immunogenes pour la produc- 
tion de vaccins comprennent de f agron avantageuse plus 
particulierement au moins I'un des peptides precedemment 
designes par env4 . envS . env6, env7, env8 > env9, env10 . 
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env1 1 voir des melanges de ceux-ci. 

Parmi ces peptides aptes a constituer des 
principes actifs de vaccins certains sont particulie- 
rement preferes Car ils possedent une structure de base 
en acides amines correspondant a des regions des glyco- 
proteines d'enveloppe qui presentent un important degre 
de conservation, non seulement dans les HIV-2, et dans 
les SIV, mais egalement dans les HIV-1. Ces peptides 
particulierement preferes sont les peptides designes par 
env4 , certains peptides env5 , env6 et env10 , 

Dans un mode de realisation prefere de 1* in- 
vention les peptides immunogenes (ou fragments de ces 
peptides) aptes a constituer des principes actifs de 
vaccins sont choisis parmi ceux dont les formules cor- 
respondent a des sequences qui, dans les glycoproteines 
d'enveloppe de HIV-2, SIV et HIV-1 presentant une 
homologie en acides amines superieure a 50%, qui appar,- 
tiennent a la partie externe.de I'enveloppe du virus, 
qui sont depourvus ou presque de deletions, et qui ren- 
ferment des residus de cysteine favorables a la stabili- 
sation des liaisons et k la constitution de boucles 
d ' ancrage . 

Les peptides suivants appartiennent a cette 
categoric de peptides preferes . 
env4 

XVTV-YGVP-W--ATZ 
envS 

XL-NVTE-FZ 
env6 

XKPCVKL-PLC-Z 
env7 

XN-S-I-Z 
envIO 

XNC-GEF-YC-Z 
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envl 1 
XC-I-Q-IZ 

Des compositions pharmaceutiques avantageuses 
sont constituees par des solutions, suspensions ou li- 
posomes injectables contenant une dose efficace d'au 
moins un produit selon 1' invention, De preference, ces 
solutions, suspensions ou liposomes sont realises dans 
une phase aqueuse sterilisee isotonique, de preference 
saline ou glucosee, 

L' invention concerne plus particulierement de 
telles suspensions, solutions ou forme liposome qui sont 
aptes a etre administrees par injections intradermiques, 
intramusculaires ou sous-cutanees, ou encore par scari- 
fications . 

Elle concerne egalement des compositions phar- 
maceutiques administrables par d'autres voies, notamment 
par voi^ orale. 

Les compositions pharmaceutiques selon 1' in- 
vention, utilisables en tant que vaccins pour etre effi- 
caces dans la production d'anticorps centre le virus 
HIV-2, peuvent a titre d'exemple etre administrees a des 
doses situees entre 10 et 500 pg/kg, de peptides selon 
1' invention, de preference de 50 a 100 pg/kg- 

Ces doses sont ditees a titre d'exemple et ne 
posseden-t en aucun cas un caractere limitatif • 

Comme on I'a deji. indique plus haut les dif- 
f erents peptides qui ont ete def inis peuvent comprendre 
des modifications qui n*ont pas pour effet de modifier 
de fagron fondamentale leurs proprietes immunologiques . 
Les peptides Equivalents qui en resultent entrent dans 
le champ des revendications qui suivent. A titre d'exem- 
ples de peptides equivalents on mentionnera ceux dont 
les structures en correspondance avec des regions des 
ADNc d'autres variants de HIV-2 de SIV ou de HIV-1, 
lorsque ces regions ont ete mises en alignement dans des 
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conditions semblables a celles qui ont ete evoquees 
ci-dessus, a propos de HIV-2 ROD, SIV et HIV-1 BRU, A 
titre d'autres de ces peptides, on mentionnera ceux dont 
^ les structures sont en correspondance avec de telles 
regions dans les ADNc qui ont fait I'objet de depots a 
la CNCM, notamment sous les numeros 1-502, 1-642 (HIV-2 
IRMO), 1-643 (HIV-2 EHO) ainsi que, dans les cas 
appropries, des variants de HIV-1 qui ont fait I'objet 
de depots a la CNCM sous les numeros 1-232, 1-240, 
1-241, 1-550, 1-551 . 

Les peptides selon 1' invention peuvent encore 
etre definis par les formules suivantes (dans lesquels 
X, Z et les tirets ont les significations sus-indi- 

quees) : 
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XRV-AIEKYL-DQA-LN-WGCAFRQVCZ 
XAIEKYL-DZ 

X-LE-AQIQQEKNMYELQKLNSWZ 
XQIQQEKNZ 

XELGDYKLVEITPIG-APT— KR Z 

XYKLVEITPIG-APT — KRZ 



X VTV-YGVP-W--AT — LFCA-Z 

XVTV-YGVP-W — ATZ 



X ^^E — L-NVTE-F — W-NZ 

XL-NVTE-FZ 

15 

XL S-KPCVKIr-PLC -Z 

XKPCVKL-PLC-Z 
XS-KPCVKL-PLC-Z 

2Q X N-S-I C-Z 

XK-S-I-Z 

XYC-P-G-A-Lr-C-N-TZ 

X A-C W-Z 

NKRPRQAWCWFKG-KWKD 

X-G-DPE NC-GEF-YC N.Z 

30 

X c-I-Q-I~ G YZ 
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L* invention concerne egalement outre les pep- 
tides de SIV deja decrits, les proteines codees par 
I'ADNc du virus SIV. Elle concerne egalement les pro- 
teines de tout virus immunologiquement etroitement ap- 
parente a SIV-1mac, en particulier tout virus dont les 
proteines et les glycoproteines d'enveloppe croisent 
immunologiquement et dont les ADNc presentent un pour- 
centage d'homologie d'au moins 95'^ et de preference d'au 
moins 98%. 

En particulier 1 * invention concerne : 
1/ les proteines et glycoproteines de I'enveloppe codees 
par le gene env et representees a la figure 3, 
2/ la proteine GAG representee a la figure 4, 
3/ la proteine POL representee a la figure 5, 
4/ la proteine Q representee a la figure 6, 
5/ la proteine R representee a la figure 7, 
6/ la proteine X representee a la figure 8, 
7/ la proteine F representee a la figure 9, 
8/ la proteine TAT representee a la figure 10, 

Les acides amines des proteines precitees de 
SIV, ont ete representees en alignement avec les se- 
quences d' acides amines des proteines correspondantes du 
virus HIV-2 ; les points verticaux figurant entre les 
deux sequences correspondent aux acides amines communs 
entre les proteines des deux -virus. 

Les sequences d'ADNc codant pour les proteines 
precitees apparaissent sur la figure IB. L' invention 
concerne, outre les sequences nucleiques precitees toute 
sequence nucleiques modifiee, qui code Egalement pour 
les proteines du retrovirus SIV ou d'un variant. 

Ces sequences d'ADNc reperees par la numerota- 
tion figurant sur les sequences decrites precedemment 
(figure 1B) sont les suivantes : 
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-sequence codan-t pour GAG . ■ nucleotides 551 i 2068 





n 


tr 




II 


1726 


a 4893 





tt 


u 


Qr 


n 


4826 


a 5467 




u 


n 


X, 


n 


5298 


i 5633 




n 


Q 


R, 


M 


5637 


k 5939 




u 


n - 


Fr 


n 


8569 


a 9354 




n 


tt 


TAT-1 


R 


5788 


a 6084 




a 


n 


ART-1 


tt 


6014 


4 6130 




n 


ti 


TAT-2 


n 


8296 


a 8391 




tt 


If 


ART- 2 


It 


8294 


i 8548 




» 


» 


ENV 


tt 


6090 


4 8732 
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L ' invention concerne done naturellemenl: les 
proteines precedemtaent decrites, lorsqu'elles sont 
obtenues a partir du virus SIV ou lorsqu'elles sont 
preparees pax une methode de synthese, notamment par 
I'une des methodes deja citees en rapport avec la syn- 
tbese des peptides de plus petite taille. 

L' invention concerne egalement 1 'utilisation 
des proteines precedentes pour le diagnostic de la pre- 
sence eventuelle d'anticorps diriges centre les pro- 
teines de HIV-2, voire contre HIV-2 en entier, ou pour 
certaines d'entre elles 1* utilisation aux fins de dia- 
gnostic d'une infection due a l*un des virus HIV. Ainsi 
le peptide GAG code par le gene correspondant peut etre 
utilise pour repe'rer la presence eventuelle d'anticorps 
anti-HlV-1 ou anti-HI\r-2. Les proteines ENV sont utili- 
sees de preference pour le diagnostic specif ique d'une 
infection due a HIV-2 ou un de ses variants, parfois 
pour le diagnostic d'une infection par HIV-2 ou HIV-1. 

L' invention concerne done egalement un precede 
de diagnostic in vitro de detection d'anticorps contre 
HIV-2 et eventuellement contre HIV-1 dans des fluides 
biologiques et en particulier dans des serums humains. 
De tels precedes applicables pour 1 'utilisation des pro- 
25 teines precedentes de SIV comme proteines de diagnostic, 



ont deja ete d^crits dans la presente invention. 

L' invention concerne aussi des cof frets ou 
"kits" pour le diagnostic in vitro de la presence d'an- 
ticorps le virus HIV-2 et dans certains cas contre HIV-1 
dans un milieu biologique. De tels kits mettant en oeu- 
vre les peptides precedents ont egalement ete d^crits 
dans la presente invention. 

L' invention concerne egalement des composi- 
tions immunogenes pour la production de vaccins, dont le 
principe actif est constitue de fagon avantageuse par au 
moins la partie de la proteine MY du virus SIV; cette 
proteine pouvant etre sous forme conjugu^e avec une mo- 
lecule porteuse. Ces compositions immunogenes induisent 
la production d'anticorps contre le susdit peptide en 
quantite suffisante pour inhiber les proteines du re- 
trovirus HIV-2, voire le retrovirus HIV-2 lui-meme. 

Toutefois 1* utilisation aux fins de diagnostic 
des proteines • de SIV n'est en rien limitee a celle des 
seuls proteines ENV gu GAG- D'autres proteines parmi 
celles decrites peuvent etre envisagees, pour preparer 
des compositions de diagnostic voire de vaccin. 
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REVENDICATIQNS 

1/ Peptide ayant des proprietes immunologiques en 

commun avec celles de l*ossature peptidique de la glyco- 
proteine d'enveloppe des virus de la classe HIV-2, ca- 
5 racterise en ce qu'il a. egalement une s-tructure pepti- 
dique" en commun avec I'ossatuxe peptidique de la glyco- 
proteine de SIV.1. 

2/ Peptide ayant des proprietes immunologiques en 

commun avec celles de I'ossature peptidique de la 
-JO glycoproteirie d'enveloppe des virus de la classe HIV-2^ 
. ces -peptides contenant un nombre de residua d'acides 
amines n'excedant pas 40, caracterise en ce qu'il a 
egalement une structure peptidique en commun avec 
I'ossature peptidique de la glycoproteine de SIV.l. 
3/ Peptide selon la revendication 2 caracterise 

par 1 • une des f ormules : 
XRV-AIEKYL-DQA-LN-WGCAFRQVCZ 
XAIEKYL-DZ 

dans laquelle- X et Z. sont des . groupements OH ou NH^ ou, 
20 dans la mesure ou les proprietes immunologiques du 
peptide depouxvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de t a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
25 de conserver au peptide sus-defini les proprietes immu- 
nologiques de l*une des sequences suivantes : 
RVTAIEKYLQDQARLNSWGCAPRQVC 

AIEKYLQDQ 
RVSAIEKYLKDQAiEJLNAWGCAFRQVC 
3Q AIEKYLKDQ 

4/ Peptide selon la revendication 2 caracterise 

par *l*une des formules : 
. X-LE-AQIQQEKNMYELQKLNSWZ 
XQIQQEKNZ 

35 dans laquelle X'et Z sont des groupements OH ou NH- ou, 
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dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s ' en trouvent pas es- 
sentiellement modifiees, des groupes comportant de. 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini. les proprietes immu- 
nologiques de I'une des sequences suivantes : 
SLEQAQIQQEKNMYELQKLNSW 

QIQQEKN 
LLEEAQIQQEKNMYELQKLNSW 

5/ Peptide selon la revendication 2 caracterise 
par I'une des formules : 
XELGDYKLVEITPIG^APT~KR Z 

XYKLVEITPIG-APT~KRZ 
dans laquelle X et Z sont des groupements OH ou NHj ou, 
dans la mesure ou les proprietes ijjimunologiques du 
peptide depourvu de ces groupes ne s " en trouvent pa3 es- 
sentiellement modifiees, des groupes comportant de 1 ^ 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
ELGDYKLVEITPIGFAPTKEKRYSSAH 

YKLVEITPIGFAPTKEK 
ELGDYKLVEITPIGLAPTNVKRYTTG- 

YKLVEITPIGLAPTNVK 
6/ Peptide selon la revendication 2 caracterise 

par l*une des formules : 
X VTV-YGVP-W~AT~LFCA-Z 

XVTV- YGVP-W- -ATZ 
dans laquelle X et Z sont des groupements OH ou NH2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
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a un residu aminoacyle choisi parmi ceux qui permettent 
de conserverau peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
CTQYVTVFYGVPTWKNAT I PLFCAT 

VTVFYGVPTWKNAT 
CIQYVTVFYGVPAWRNATI PLFCAT 

VTVFYGVPAWRNAT 
EKLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
7/ Peptide selon la revendicatiqn 6 caracteris6 

par I'une des formules : 
CTQYVTVFYGVPTWKNATIPLFCAT 

VTVFYGVPTWKNAT 
CIQYVTVFYGVPAWRNATIPLFCAT 

VTVFYGVPAWRNAT 
EKLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
EDLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
DNLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
8/ Peptide selon la revendication 2 caracteris^ 

par I'une des formules : 

X -E— L-NVTE-F~W-NZ 

XL-NVTE-FZ 

dans laquelle X et Z sont des groupements OH ou NH2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depoiirvu de ces groupes ne s ' en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 A 5 
rSsidus d'acides amines, et chacun des tirets correspond 
a un rSsidu euninoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-de£ini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
DDYQEITL-NVTEAFDAWNN 
L-NVTE 
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DDYSELAL-NVTESFDAWEN 
PNPQEWLVNVTENFNMWKN 
LVNVTE 

9/ Peptide selon 

par I'une des formules : 
DDYQEITL-NVTEAFDAWNN 

L-NVTEAF 
DDY SELAL -NVTESFDAWEN 

L-NVTESF 
PNPQEWLVNVTENFNMWKN 

LVNVTENF 
PNPQEI ELENVTEGFNMWKN 

LENVTEGF 
PNPQEIALENVTENFNMWKN 

LENVTENF 
10/ Peptide selon 

par I'une des formules : 

XL S-KPCVKL-PLC Z 

XKPCVKLTPLCVZ 
XS-KPCVKLTPLCVZ 
dans laquelle X et Z sont des groupements OH ou NHj ou, 
dans la mesure oi les proprietes inununologiques du pep- 
tide d^pourvu de ces groupes ne s'en trouvent pas essen- 
tiellement modifiees, des groupes comportant de 1 4 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
LFETSIKPCVKLTPLCVAMK 
LFETSIKPCVKLSPLCITMR 
LWDQSLKPCVKLTPLCVSLK 
KPCVKLTPLCV 
KPCVKLSPLCI 
SLKPCVKLTPLCV 
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11/ Peptide selon la revendication 10 caracterise 

par I'une des structures suivantes : 

LFETSIKPCVKLTPLCVAMK 

LFETSIKPCVKLSPLCITMR 

LWDQSLKPCVKLTPLCVSLK 

LWDQSLKPCVKLTPLCVTLN 

PCVKLTPLCV 

KPCVKLSPLCI 

127 Peptide selon la revendication 2 caracterise 

en ce qu'il contient la structure de base : 

X C-Z 

XN-S-I-Z 

dans laquelle X et Z sent des groupements OH ou ou, 
dans la mesure ou . les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides aminjes, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
NHCNTSVITESCD 

NTSVIT 
NHCNTSVIQECCD 

NTSVIQ 
TSCNTSVITQACP 

NTSVIT 

13/ Peptide selon la revendication 12 caracterise 

par I'une des formules suivantes : 

NHCNTSVITESCD 

NTSVIT 
NHCNTSVIQECCD 

NTSVIQ 
TSCNTSVITQACP 

. NTSVIT 
INCNTSVITQACP 
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NTSVIT 
INCNTSAITQACP 
NTSAIT 

14/ Peptide selon la revendication 2 caracterise 

par I'une des 'formulas suivantes : 

XYC-P-G-A-L-C-N-TZ 

dans laquelle X et Z sent des groupements OH ou ou, 
dans la mesure oil les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en txouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle chpisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
YCAPPGYALLRC-NDT 
YCAPAGFAILKCNNKT 

15/ . Peptide selon la revendication 14 caracterise 

par I'une des formules : 

YCAPPGYALLRC-NDT 

YCAPAGFAILKCNNKT 

YCAPAGFAILKCNDKK 

YCAPAGFAILKCRDKK 

16/ Peptide selon la -revendication 2 caracterise 

par la formule : 

X A-C W~Z 

dans laquelle X et Z sont des groupements OH ou NH2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
d un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
NKRPRQAWCWFKG-KWKD 
NERPKQAWCRFGG-NWKE 
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N— MRQAHCNISRAKWNA 

17/ Peptide selon la revendication 16 caracteris^ 

par la formule suivante : 

NKRPRQAWCWFKG-KWKD 

NERPKQAWCRFGG-KWKE 

N~MRQAHCNI SRAKWNA 

D— IRRAYCTINETEWDK 

I — I GQAHCNI SRAQWSK 

18/ Peptide selon la revendication 2 caracterise 

par la formule suivantes : 

X-G-DPE NC-GEF-YC- NZ 

XNC-GEF-YC-2 

dans laquelle X et Z sont des gzoupements OH ou ou, 
dans la mesure otl les propri^tes iinmunologiques du 
peptide depoiirvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
d un rSsidu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les propri^tes immu- 
nologiques de I'une des sequences suivantes : 
KGSDPEVAYMWTNCRGEFLYCNMTWFLN 

NCRGEFLYCN 
GG-DPEVTFMWTNCRGEFLYCKMNWFLN 

NCRGEFLYCK 
-GGDPEIVTHSFNCGGEFFYCaiSTQLFN 

NCGGEFFYCN 

19/ Peptide selon la revendication 1 8 caractSrisS 

par I'une des structures suivantes : 
KGSDPEVAYMWTNCRGEFLYCNMTWFLN 

NCRGEFLYCN 
GG-DPEVTFMWTNCRGEFLYCKMNWFLN 

NCRGEFLYCK 
-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN 
-GGDPEITTHSFNCRGEFFYCNTSKLFN 
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NCRGEFFYCN 
-GGDPEITTHSFNCGGEFFYCNTSGLFN 
NCGGEFFYCN 

20/ Peptide selon la revendication 2 caract^rise 

par I'une des formules suivantes : 

X c-i-Q-i G— yz 

XC-I-Q-IZ 

dans laquelle X et Z sont des groupements OH ou ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 4 5 
residus d'acides amines, et chacun des tirets correspond 
a , un residu aminoacyle choisi parai ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
RNYAPCHiKQIINTWHKVGRNVY 

CHIKQII 
RNYVPCHIRQI INTWHKVGKNVY 

CHIRQII . ' 

TITLPCRIKQFINMWQEVGKAMY 
CRIKQFI 

21/ Peptide selon la revendication 20 caract^rise 

par I'une des structures, suivantes : 
RNYAPCHIKQIINTWHKVGRNVY 

CHIKQII 
RNYVPCHIRQIINTWHKVGKNVY 

CHIRQII 
TITLPCRIKQFINMWQEVGKAMY 

CRIKQFI 
S I TLPCRIKQI INMWQKTCKAMY 

CRIKQII 
NITLQCRIKQIIKMVAGR-KAIY 

CRIKQII 

22/ Peptide antigenique aaa1 , caracterise par 

I'une des structures de base : 
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XDCKLVLKGLGMNPTLEEMLTAZ 
XDCKLVLKGLGTNPTLEEMLTAZ 

dans lesquelles X et Z sont des groupements OH ou 
ou, dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces gxoupes ne s ' en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et dans lesquelles chacun des 
tirets correspond a un residu aminoacyle choisi parmi 
ceux qui permettent de conserver au peptide sus-def ini 
les proprietes immunologiques de I'une ou 1' autre des 
sequences suivantes z 
DCKLVLKGLGMNPTLEEMLTA 
DCKLVLKGLGTNPTLEEMLTA 

23/ Sequence nucleotidique caracterisee en ce 

qu'elle renferme tout ou partie de la sequence d'acides 
nucleiques definie a la figure IB. 

24/ Sequence nucleotidique caracterisee en ce 

qu'elle renferme tout ou partie de la sequence d'acides 
nucleiques definie a la figure 1C. 

25/ Sequence nucleotidique selon la revendication 

23, caracterisee en ce qu'elle comprend les sequences 
nucleotidiques : 

GAG s'etendant entre les nucleotides 550 a 2068 
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•26/ Peptide ayant une structure peptidique en 

commun avec I'ossature peptidique de SIV-1, caracterise 
en ce qu'il comprend tout ou partie des sequences d'a- 
cides amines parxni les sequences suivantes : 
ENV representee k la figure 3 
GAG " » 4 

POL " "5 

Q » " 6 

R " " 7 

X " " 8 

F • " 9 . 

TAT • " 10 

ART • " 

27 / Acide nucleique recombinant caracterise en ce 

qu'il comprend la totalite ou une partie d'un ADNc selon 
I'une quelconque des revendications 23 a 25, insere dans 
un acide nucleique provenant d'un vecteur. 
28/ Acide nucleique recombinant selon la reven- 

dication 27, caracterise en ce qu'il est marque. 
29/ Composition antigenique contenant le peptide 

gag selon la revendication 26 ou 27, au moins un peptide 
gagi selon la revendication 22 ou au moins un oligomere 
de ce peptide, caracterisee en ce qu'elle a la capacite 
d'etre reconnue par des fluides biologiques d'origine 
humaine, notamment des serums contenant des anticorps 
anti-HIV-2 et dans une certaine mesure des anticorps 
anti-HIV-1 . 

30/ Composition antigenique contenant le peptide 

env selon la revendication 26 ou au moins un peptide se- 
lon les revendications 3, 4 et 5 ou au moins un oligo- 
mere de ce peptide, caracterisee en ce qu'elle recon- 
naissent specif iquement la presence d ' anticorps centre 
HIV-2. 

31/ Composition immunogene contenant tout ou par- 

tie du peptide env selon la revendication 26 ou au moins 
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un pep-tide ou au moins un oligomere de ce peptide ou ce 
peptide sous forme conjuguee avec une molecule porteuse, 
selon les revendications 6 a 21, en association avec un 
.vehicule pharmaceutique acceptable pour la production de 
vaccinSr caracterisee en ce qu'elle induit la production 
d'anticorps contre les susdits peptides en quantite suf- 
fisante pour inhiber efficacement les proteines du re- 
trovirus HIV-2, voire meme le retrovirus HIV-2 entier, 
32/ Composition immunogene selon la revendication 

31 caracterisee en ce qu'elle contient les peptides dont 
les formules correspondent a des sequences qui, dans les 
glycoproteines d'enveloppe de HIV-2, SIV-1 et HIV-1 
p^^^sentent tone homologie en acides amines superieure a 
50% . 

33/ Composition immunogene selon I'une des reven- 

dications 31 ou 32, caracterisee en ce qu'elle contient 
au moins un peptide ou au moins un oligomere de - ce pep- 
tide ou ce peptide sous forme conjuguee avec une mole- 
cule porteuse choisi parmi env4, env5, env6 et envIO , 
34/ Precede, de diagnostic in vitro de 1* infection 

par HIV-2 dans un liquide biologique comprenant : 

la mise en contact de ce liquide biologique 
avec au moins un peptide selon I'une des revendications 
1, 2, 3, 4, 5, 22 ou un conjugue de ces peptides avec 
une moldcule porteuse ou des peptides gag ou env selon 
la revendication 26. 

- la detection de la presence eventuelle d'un 
complexe antigene-anticorps par des methodes physiques 
ou chimiques, dans ledit liquide biologique. 
35/ Precede de diagnostic in vitro de 1' infection 

par HIV-2 dans un liquide biologique selon la revendi- 
cation 34, caracterise en ce que la detection du com- 
plexe antigene-anticorps eventuellement forme est rea- 
lisee grace a des tests immunoenzymatiques (du type 
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ELISA) immunof luorescents (du type IFA) radioimmunolo- 
giques (du type RIA) ou des tests de radioimmunopreci- 
pitation (du type RIPA) . 

36/ Kit pour le diagnostic in vitro de 1' infection 

par HIV-2 dans un liquide biologique caracterise en ce 

5 

qu'il comprend : 

- une composition peptidique contenant un peptide selon 
I'une des revendications 1 a 5, 22, ou un melange de ces 
peptides, ou un conjugue de ces peptides avec une mole- 
cule porteuse, ou les peptides aag ou any selon la 
revendication 26, 

- un reactif pour la constitution du milieu propice a la 
realisation d'une reaction immunologique, 

- un ou plusieurs reactifs eventuellement marque pour la 
detection du' complexe antigene-anticorps forme par la 
reaction immunologique, 

- un liquide biologique de reference depourvu d* anti- 
corps reconnus par la susdite composition peptidique. 

20 
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FIG. l.Ai 



HIV2.R0I) 
^ R 

j GTCGCTCTGCGGAGAGGCTGGCAGATTGAGCCCTGGGAGGTTCTCTCCAGCACTAGCAGG 

• • • • r • 
TAGAGCCTGGGTGTTCCCTGCTAGACTCTCACCAGCACTTGGCCGGTGCTGGGCAGACGG 

100 -R I US 

CCCCACGCTTGCTTGCTTAAAAACCTGT TAATAAA.G CTGCCAGTTAGAAGC^AGTTAAGT 

• • • • • ♦ 

GTCTGCTCCCATCTCTCCTAGTCGCCGCCTGGTCATTCGGTGTTCACCTGAGTAACAAGA 

200 • * • • * ' 

CCCTGGTCTGTTAGGACCCTTCTTGCTTTGGGAAACCGAGGCAGGAAAATCCCTAGCACG 

300 

TTGGCGCCTGAACAGGGACTTGAAGAAGACTGAGAAGTCTTGGAACACGGCTGAGTCAAC 

• • • ♦ • 

GCAGTAAGGGCGGCAGGAACAAACCACGACGGAGTGCTCCTAGAAAGGCGCGGGCCGAGG 

400 • . • 

fACCAAAGGCAGCGTGTGGAGCGGGAGGAGAAGAC;CCTCCGGCT^:?AAGGTAAGTACCTA 

• • . • • • • • 

CACCAAAAACTGTAGCCGAAAGGGCTTGCTArCCT.4::CTT7AaArAGGTA.G^AGATTGT6 

500 - . > • • 

MetGlyAlaArgAsnSerValLeuArgGlyL/aLyjAlaAspi^lyLecGluArglle 
GGAGATGGGCGCGAGAAACTCCGTCTTCASAuGGA^AAAAGCAC-'aTGAATTAGAAAGAAT 

. * . 600 

ArgLcuArgProGIyGlyLyaLyfiLysTyrAfgLa-iLysHisI le ValTrpAlaAlaAsn 
CAGGTTACGGCCCGGCGGAAAGAAAAAGTACAGGCTAAAAvATATTGTGTGGGCAGCGAA 

• • • • • • 

LysLeuAspArgPheGlyLeuAlaGluSerLeuLeuGIuSerLysCluGIyCysGInLys 
TAAATTGGACAGATTCGGATTAGCAGAGAGCCTGTTGGAGTCAAAAGAGGGTTGTtAAAA 

700 

IleLeuThrValLeuAspProMetValProThrGlySerGluAsnLeuLyaSfcrLeuPhe 
AATTCTTACAGTTTTAGATCCAATGGTACCGACAGGTTCAGAAAATTTAAAAAGTCTTTX 

• , • • ♦ • 

AsnThrValCysVallleTrpCysIleKLsAIaGluGluLysValLysAspThrGluGly 
7AATACTGTCTGCGTCAXTTGGTGCATACACGCAGAAGAGAAAGTGAAAGATAC1GAAGG 

• 800 • • • • 
AlaLysGlnlleValArgArgHiaLeuValAlaGluThrGlyThrAlaGluLysMetPro 

AGCAAAACAAATACTGCGGAGACATCTAGTGGCACAAACAGGAACTGCAGACAAAATCCC 
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SerThrSerArgProThrAlaProSerSerCloLysClyGlyAsnTyrProValGl^ 
AAGCACAAGTAGACCAACAGCACCATCTACCGACAAGCGAGGAAATTACCCACTGCAACA 

• • * * 

ValGlyGlyAsnTyrThrHisIleProLeuSerProArgThrL uAsnAlaTrp?a^ 
TGTAGGCGGCAACTACACCCATATACCGCTCAGTCCCCGAACCCTAAATGCCTGGGTAAA 

1000 

LeuValGluGluLysLyBPheGlyAUGlaValValProGlyPheGlaAULeuS«^^ 
ATTAGTAGAGGAAAAAAAGTTCGGGCCAGAACTAGTCCCAGGATTTCAGGCACTCTCAGA 

GlyCysThrProTyrAspIleAsnGlnMetLeuAanCysValGlyAepHisClnAlaAla 
AGGCTGCACCCCCTATGATATCAACCAAATCCTTAATTGTGTCGGCGACCATCAAGCAGC 

1100 . • • . ' 

MetGlnllelleArgGluIlelleAsnCluGiuAlaAlaGiuTrpAepValGlaaisPro 

CATGCAGATAATCAGGGAGATTATCAATGAGGAAGCAGCAGAATGGCATGTGCAACATCC 

IleProGlJproLeuProAlaGlyGlnLeuArgGluProArgGlySerAspIleAlaGly 
AATACCAGGCCCCTTACCAGCGGGGCAGCTTAGAGAGCCAAGGGGATCTGACATACCAGG 

• • * 

ThrThrSerThrValCluGluGlnlleClaTrpMetPheArgProGlnAsnProValPr 

GACAACAAGCACAGTAGAAGAACACATCCAGTGGATGTTTAGGCCACAAAATCCTGTACC 

, , 1300 • 

ValGlyAanlleTyrArgArgTrpIleGlBlleGlyLeuGlnLysCysValA^ 
AGTAGGAAACATCTATAGAACATG6ATCCAGATAGCATTGCAGAAGTGTGTCAGGATGTA 

AsnProTh^AaalleL^uAspIleLysGlnGlyProLysGluProPheGlnSe^ 
CAACCCGACCAACATCCTAGACATAAAACAGGGACCAAAGGAGCCGTTCCAAAGCTAT6T 

1400 • • • ' 

AspArgPheTyrLysSerLeuArgAUGluGlnThrAspProAUValL^ 
AGATAGATTCTACAAAAGCTTGAGGGCAGAACAAACA6ATCCAGCAGTGAAGAATTGGAT 

ThrGlnThrLeuLeuVal61nA8nAlaA6aProA8pCysLy8l.eaValLeuL^ 
GACCCAAACACTGCTAGTACAAAATGCCAACCCAGACTGTAAATTAGTGCTAAAAGGACT 

■ GlyMetAsnProThrLeuGluGluMetLeuThrAlaCysGlnGlyValGlyGlyProGly 
AGGGATGAACCCTACCTTAGAAGAGATGCTGACCGCCTGTCAGGGGGTAGGTGGGCCAGG 

, : . 1600 

GlnLvsAllAreLeuMetAirGloAlaLeuLyi'GluVallleGlyProAlaProIlePr 
C?iSJllGJjlGAWAX?5cilGAGGCCCTGAAAGAGGTCATAGGA€CTGCCCCTAICCC 

. • • 

PheAlaAUAlaClnGlnArgLysAlaPheLysCysTrpAanCysGlyLysGluGlyHia 

ATTCGCAGCAGCCCAGCAGAGAAAGGCAXTTAAATGCTGGAACTGTGGAAAGGAAGGGgA 
SerAlaAricinCyeArjAlaProArgArgClnGlyCylTrpLysCy.GlyLysPr^^^^ 

ctSggcaagacaatgccgagcacctagaaggcagggctgctggaagtgtggtaagccacg 

ThrGlyArgPhePheArgTbrGlyProI.ettGly 
HisIlcMetThrA.nCysProAapArgGlnAUGlyPbeLeuGlyLeuGlyProTrpGly 
ACACATCATGACAAACTGCCCAGATAGACAGGCA6GTTTTTTAGGACTGGGCCCTTG6GG 

LysGluAlaProGlaLeaPtoArgGlyProSerSerAlaGlyAlaAspThrAsnSer^ 

iysLyeProArgAsnPheProValAlaGlaValProGluGlyLeaThrProTh^^^ 
AAAGAAGCCCCGCAACTTCCCCGTGGCCCAAGTTCCGCAGGGGCTGACACCAACAGCACC 

. 1900 

ProSerGlySerSerSerGlySerThrGlyGluIleTyrAlaAlaArgGluLyfTJrGl^ 

ProValAapProAUValAapLeuL^uGlaLysTyrMetGlaGloGlyLys^^^^ 
CCCAGTGGATCCAGCAGTGGA1CTACI6GACAAATATATGCAGCAAGG6AAAAGACAGAC 

ArgAlaGluIrgCluThrneGlaGlySerAspAxgGlyleuThrAlaProArgAlaGly 

GluGlnArgGluArgProryrLy.6luValThrGl«A8pI.euLeaHx«Le«^^^ 
AGAGCAGAGAGACAjeACCATACAAGGAACTGACAGAGGACTTACTGCACCTCCAGCAGCG 

( fig. lA-8uite i) 
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ClyAepThrileGlnGlyAUThrAsnArsGlyLeuAlaAlaProGlnPheScrLe^^^^ 

ciuTkrProTyrArgGluPr ProThrGluAspLeuLeuK isLeuAsnSexLc^^^ 
GGAGACACCATACAGGGAGCCACCAACAGAGGACTTGCTGCACCTCAATTCTCTCTTTGC 

LysArgProklValThrAiaTyrlleCluGlyGlnProValGluValLeuLeuAspThr 

aJ:IIgI?c1Stagtcacagcatacattgacggtcagccagtagaagtcttgttagaca'ca 

^ » • • 

GlyAlaAspLpSerllevIuUGlylleGluLeuGlyAsnAflnTyrSerProL^^^ 

ggggctgacgactcaatagtagcaggaatagagttagggaacaattatagcccaaaaata 

2200 

ValClyGlyJleGlyGLyPhelleAsnThrLysGluTyrLysAsnValGl^^^^^^ 
CTAGGGGGAATAGGCGGATTCATAAATACCAAG6AaTAXaaAaaTvTAv,/xAA*A-„AC.1. 

LeuAsnLysLysValArgAlaThrlleMetThrGlyAspThrProIleAsnlle^^^ 
CTAAATAAAAAGGTACGGGCCACCATAATGACAGGCGACACCCCAATCAACATTTTTGGC 

ArgAsnlleLuThrAlaLeuGlyMetSerLeuAsnLeoProValAlaLysVal^ 

agaaatattctgacagccttaggcatgtcattaaatctaccagtcgccaaagtagagcca 

IleLysIleMetLeuLysProGlyLysAsiGlyProLysLeuArgGlnTrpProLe^^ 

atIaIaataatgctaaIgccagcgaaagatggaccaaaactgagacaaiggcccttaaca 

LysGluLysheGluAlaLeuLysGlulleCysGluLysMetGluLysGluGlyGlnL^^ 

aaagaaaaaatagaagcactaaaagaaatctgtgaaaaaatggaaaaagaaggccagcta 

2500 

CluGluAlaProProThrAsnProTyrAsnThrFtoThrPheAlalleLysLy^ 

gaggaagcacctccaactaatccttataatacccccacatttgcaatcaagaaaaaggac 

ThrGluIleGlnLeuGlylleProHisProAUGlyLeoAlaLysLys^^ 

acagaaattcagttacgaattccacacccagcagggttggccaagaagagaagaaxtact 

ValLeuAspValGlyAspAlaTyrPheSerlleProLeuHlsGluAspPheArgPtoTyr 
C?ic?lGlTG?AGGGGAT6CTTACTTTTCCATACCACTACAIGAGGACTTTACACCATAr 

ThrAUPheThrLeuProSerValAsnAsnAUGluProGlyLysArgTyrlleTyrLys 
ACTGCATTTACTCTACCATCA6TGAACAATGCAGAACCAGGAAAAAGATACATATATAAA 

2800 • ♦ 

v-iT»..PrnGlnGlvTrt.LT»GlTSerProAlaIlePheGloHi8ThrMetArgGlnVal 
JTJi?GcJl"SGJA?GSiAScaA«IcCAGCAATTTTTCAACACACAATGAGACA6GTA 

. • • ' * 

TAwCluProPheArsLvsAlaAsnLyeAspValllellelleGlnTyrMeCAspAspIle 

llAGi^?JA?J?lGiJ:IlJalAACAlGGATGTCATTATCATTCAGTACATGGATGATATC 

2900 • • • * * 

L»uIleAlaSerA8DArKThrAspLeuGluHisA8pArg7al7alLeuGlnLeuLy»Glu 

^?^^i^G^^lS^^I^^Gl^S^GA;TTAGAACA.IGATAGGGTAGTCCTGCAGCTCAAGp^ 

LeuLeuAsaGlyLeuGlyP^eSerThrPr^AapGluLysPheGlnLyjAs^ 
CTTCTAAATGGCCTAGGATTTTCTACCCCAGATGAGAAGTTCCAAAAAGACCCTCCATAC 

HisTrpMetGlyTyrGluLeuTrpProTbkyaTrpLysLuGlnLyalleGlnLe^^ 
CACTGGATGGGCTATGAACTATGGCCAACTAAATGGAAGTTGCAGAAAATACAGTTGCCC 

3100 

GlnLysGluileTrpTbrValAanAspIleGlaLysLeuValGlyValLeaAsn^^^ 
CAAAAAGAAATATGGACAGTCAATGACATCCAGAAGCTAGTGGGTGTGCTAAATTGGGCA 
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AlaGloLeuTyrProClyllcLyaThrLyflHiaLeuCysAygLcuIleArgGlyLysKet 
GCACAACTCTACCCACGGATAAACACCAAACACTTATCTAGCTTAATCACAGGAAAAATG 

3200 • . • 

ThrLeuThrGluCluValGlnTrpTbrGluLeuAlaGluAlaGluLeuGluGluAanArg 

ACACTCACAGAAGAAGTACAGTGCACAGAATTAGCAGAAGCAGAGCTAGAAGAAAACAGA 

IlelleLeuSerGlDGluGlnGluGIyHisTyrTyrClnGluGluLyaGluLeuGluAla 
AIIATCWAAGCCAGGAACAACAGGGACACTAXTACCAAGAAGAAAAAGAGCTACAACCA 

TSrValClnLysAspGluGluAsnGluTrpThrTyrLysIleHisGlnGluGluLysIle 
AGAGTCCAAAAGGATCAAGAGAATGAGTGGACATATAAAATACACCAGGAAGAAAAAATT 

LeuLysValGlyLysXyrAlaLysValLysAsnThrHisThrAsnClylleArgLeuLea 
CTAAAAGTAGGAAAATATGCAAACGTGAAAAACACCCATACCAATGGAATCAGAXTGTTA 

AlaGlaValValGlnLysIleGlyLysGluAlaLeuVallleXrpGlyArglleProLys 
GCACAGGXAGXXCAGAAAAXAGGAAAAGAAGCACXAGXCAXXXGGGGACGAAXACCAAAA 

3500 . * • • 

PheHisLeuProValGluArgGluIleXrpGluGlnXrpXrpAspAanXyrXrpGlnVal 
XXXCACCXACCAGXAGAGAGAGAAAXGXCGGAGCAGXGCXGCGAXAACXACXGGCAAGXG 

3600 

XhrXrpIIeProAspXrpAapPheValSerXhrProProLeuValArgLeuAlaPhcAsn 
ACAXGCAXCCCAGACXGCGACXXCCXGXCXACCCCACCACXGGXCAGGXXAGCGXXXAAC 

LeuValGlyAspProIleProClyAlaCluXhrPheXyrXbrAapGlySerCysAanArg 
CXGGXAGGGGAXCCXAXACCAGGXGCAGAGACCXXCXACACACAXGGAXCCXGCAAXAQG 

3700 

GlnSerLysGluGlyLysAlaGlyXyrValXhrA8pArgGlyLy8A8pLy8ValLysI.yQ 
CAAXCAAAAGAAGGAAAAGCAGGAXAXGXAACAGAXAGAGGGAAAGACAAGGtAAAGAAA: 

LeuGluGlnXhrXhrAsnGlnGlnAlaGluLeuG luAlaPheAlaMefcAIaLeuXhrAap 
CXAGAGCAAACXACCAAXCAGCAAGGAGAACXAGAAGCCXXXGCGAXGGCACXAACAGAC 

'3800 • • • ♦ 

SerGlyProLyaValAflnllelleValAapSerGlnXyrValMetGlylleSerAlaSer 

XCGGGXCCAAAAGXXAAXAXXAXAGXAGACXCACAGXAXGXAAXGGGGAXCAOXGCAAGC 

3900 

GlnProXbrGluSerGluSerLyalleValAanGlnllelleGluGluMetlleLysLya 
CAACCAACAGAGXCAGAAAGXAAAAXAGXGAACCAGAXCAXAGAAGAAAXGAXAAAAAAG 

• 5 3« • • • * 

GluAlalleXyrValAlaXrpValProAlaHiaLyaGlylleGlyGlyAsnGlnGlttVal 
GAAGCAAXCXAXGXXGCAXGGGXCCCAGCCCACAAAGGCAXAGGGGGAAACCAGGAAGTA 

4000 

AapHiaLeuValSerGlnGlylleArgGlnValLeuPbeLeuGluLyelleGluProAla 
GAXCAXXIAGXGAGXCAGGGXAICAGACAACXGXXCXXCCXGGAAAAAATAGAGCCCGCT 

GlnGXaGluHisGluLysXyrHiaSerAanValLysGluLeuSerHiaLyaPbeGlylle 
CAGGAAGAACAXGAAAAAXAXCAXAGCAAXGXAAAAGAACXGXCXCAXAAAXXXGCAAXA 

4100 • . • • ♦ 

Pr^jAanLeuValAlaArgGlalleValAanSerCysAlaGlnCyaGUGlnLyaGlyGltt 

CCCAAXXXAGXGGCAAGGCAAAXAGXAAACXCAXCXGCCCAAXGXCAACAGAAAGGGGAA 

4200 

AlalleHiaGlyGlaValAanAlaGluLcuGl^fXbrXrpGlaMetAapCyaXbrUisLeu 
GCXAXACAXGGGCAAGXAAAXGCAGAACXAGGCACXXGGCAAAXGGACXGCACACAXXTA 

• - -i • • • • 
GluGlyLyallellcIleValAlaValHiaValAlaSerGlyPbelleGluAlaGluVal 

GAAGGAAAGAICAIXAIAGXAGCACXACAXGXXGCAAGXGGAXXXAXAGAAGCAGAAGXC 

4300 

IlePr GlnGluSerGlyArgGlnXhrAlaLcuPbcLeuLeuLysLeuAlaSerArgXrp 
AXCCCACAGGAAICA6GAAGACAAACAGCACXCXXCCXAXXGAAACXG6CAAGXAGGXCG 

(f ig.lA-suite 3) 
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ProIlcTbrHisLeuHisThrAspAanGlyAlaAsnPh ThrSerGlaClu7«iry«Met 
CCAATAACACACITGCATACAGATAATCGTCCCAACTTCACTTCACACCACGTGAACATC 

ValAUTrpTrpIleGlyUeGluCl.nSerPheGlyValPr Ty^^A'''^"^}"^ "JJ" 
GTACCATGGTGGATAGGTATACAACAATCCTTTGGAGTACCTTACAATCCACAGAGCCAA 

GlyValVal'huAlaMetAsnHisHisLeuLysAsnClalleSbrGUThrllcValLeu 
GGAGTAGTAGAAGCAAIGAATCACCATCTAAAAAACCAAATAACIGAAACAATAGTACTA 

MetAUIUHisCysMetAanPheLysArgArgGlyGlyneGlyAspMecTbrProSer 
ATGGCAATTCATTCCATGAATTTTAAAAGAAGGGGGGGAATAGGGGATATGACTCCATCA 

4600 

GluArgLeuIleAsnMetlleThrThrGluGlnGluIleGlnPheLeuGlaAlaLysAsa 
GAAAGATTAATCAATATGAICACCACAGAACAAGAGATACAATTCCTCCAAGCCAAAAAT 

SerLysLeuLysAspPheArgValTyrPbeArgGluGlyArgAepGlnLeuTrpLysGly 
TCAAAATTAAAAGATTTTCGGGTCTATTTCAGAGAAGGCAGAGATCA6TTGTGGAAACGA 

4700 

ProGlyGluLeuLeuTrpLysGlyGluGlyAlaValLeuValLysValGlyThrAspIle 
CCTGGGGAACTACTGTGGAAAGGAGAAGGAGCAGTCCTAGTCAAGGTAGGAACAGACATA 

LysIlelleProArgArgLysAlaLysIlelleArgAspTyrGlyGlyArgGloGluMet 

' 6 MetGluGluAspLysArgTrp 

AAAATAATACCAAGAAGGAAAGCCAAGATCATCAGAGACTATGGAGGAAGACAAGAGATC 

AspSerGlySerHieLeuGluGlyAlaArgGluAspGlyGluMetAla , 

IleValValProThrTrpArgValProGlyArgMetGluLysTrpHisSerLeuValLys 
GATAGTGGTTCCCACCTGGAGGGTGCCA6GGAGGATGGAGAAATGGCATAGCCTTGTCAA 

4900 

TyrLeuLysTyrLysThrLysAspLeuGluLysValCysTyryalProHisHisLysVal 
GTATCTAAAATACAAAACAAAGGATCTAGAAAAGGTCTGCTATGTTCCCCACCATAAGGT 

• • • • . * 

GlyTrpAlaTrpTrpThrCysSerArgValllePheProLeuLysGlyAanSerHiaLeu 

GGGATGGGCATGGTGGACTTGCAGCAGGGTAATATTCCCATTAAAAG6AAACAGTCATCT 

5000 . . ' \ 

GluIleGlnAlaTyrTrpAanLeuThrProGluLysGlyTrpLeuSerSerTyrSerVal 

AGAGATACAGGCAXATTGGAACTTAACACCAGAAAAAGGATGGCTCTCCXCTtATTCAGT 

, . . • 5100 

ArglleThrTrpTyrThrGluLyaPheTrpThrAspValThrPrbAspCysAlaAapVal 
AAGAATAACTTGGTACACAGAAAAGTTCTGGACAGATGITACCCCAGACTGTGCAGATGT 

... 

LeuIleHisSerThrTyrPheProCysPheThrAlaGlyGluValArgArgAlBlleArg 
CCrAATACATAGCACTTATTTCCCTTGCTTTACAGCAGGTGAAGTAAGAAGAGCCATCAG 

5200 . 

GlyGloLysLeuLauSerCysCysAsnlyrProArgAlaHisArgAlaGlnValProSer 
AGG6CAAAAGTTATTGTCCTGCTGCAATTATCCCCGA6CTCATAGAGCCCAGCTACCGTC 

LeuGlnPheLettAlaLeoValValValGlnGlnAsaAspArgProGlDArgABpSerThr 

MetThrAapProArgGlttThrValPro 
ACTTCAATTTCTGGCCTTAGTGGTAGTGCAACAAAArGACA6ACCCCA<JAGAGACAGTAC 

5300 . . ♦ • 

ThrArgLysGlaArgArgArgAapTyrArgXrgGlyLeuArgLeuAlaLyaGlaAapSer 

^roGlyAaaSerClyGluGIuThrlleClyGluAlaPlieAUTrpLettAsttArgthrVal 

CACCAG6AAACA0CGGCGAAGAGACTATCGGAGAGGCCITCGCCTG6CTAAACAG6ACA6 

5400 

ArgSerHiaLysClaArgSerSerGluSerPr ThrProArgthrTyrPheProGlyyal 
GluAUII A8BArgCiuAU7alAfloHi.LeuProArgGloLettIlePhe6la7alTrp 
TAGAACCCATAAACAGAGAAGCAGTGAATCACCTACCCCGAGAACTTATIXTCCAGGXGX 

(fig.lA-suite 4) 
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AlaGluValLeuClall LeuAla 
GlnArgSerTrpArgTyrTrpHiaAapGluGlaClyMetSerGluSerTyrThrLyeTyr 

CCCAGACCTCCTCGAGATACTCGCATCATGAACAAGGGATGTCAGAAAGTTACACAAAGT 

5500 

ArgTyrLeuCysIlelleGlnLyaAlaValTyrHecHisValArgLysGlyCysTbrCys 
ATAGATATTTGTGCATAATACAGAAAGCAGTCTACATGCATGTTAGGAAAGGGTGTACTT 

LeuGlyArgGlyHisGlyProGlyGlyTrpArgProClyProProProProProProPro 
CCCTGGCGAGGGCACATGCCCCACCAGC6TGGAGACCA6CGCCTCCTCCTCCTCCCCCTC 

, 5600 . • 

MetAlaGloAlaProTbrGluLeuProPrpValAspGlyThrProLeu 

GlyLeoVal*** 

CAGGTCTGGTCTAATGGCTGAAGCACCAACAGAGCTCCCCCCCPTGGATCGGACCCCACT 

ArgGluProGlyAspGluTrpIlelleGluIleLeuArgGluIleLysGluGluAlaLeu 
GAGGGAGCCAGGGCATGAGTGGATAATAGAAATCTTGAGAGAAATAAAAGAACAA6CTTT 

. r 

LysHisPheAapProArgLeuLeuIleAlaLeuGlyLyaTyrlleTyrThrArgHisGly 

MeCGIu 

AAAGCATTTTGACCCTC6CTTGCTAATTGCTCTTGGCAAATATATCTATACTAGACATGC 

5800 

AapThrLeuGluGlyAlaArgGluLeuIleLysValLeuGlnArgAlaLeuPheThrHia 
ThrProLeuLyaAlaProGluSerSerLeuLyaSerCysAsoCluProPheSerArgThr 
AGACACCCTTGAACGCGCCA6AGA6CTCATTAAAGTCCTGCAACGAGCCCTTTTCACGCA 

PheArgAlaGlyCysGlyHisSerArglleGlyGlnThrArgClyGlyAanProLeuSer 

SerGluGlnA8pValAlaIhrGlnGloLeuAlaArgClnGIy61o61uIleLeuS«rGlij; 

CTTCAGAGCAGGATGTGGCCACTCAAGAATTGGCCAGACAAGGGGAGGAAATCCTCTCTC 

5900 ...» 

AlalleProThrProArgAanMetGlo 
LeuTyrArgProLeuGluThrCysAanAanSerCyalyrCyaLyaArgCyaCyaTyrHxa 

AGCTATACCGACCCCTAGAAACATGCAATAACTCATGCTAITGTAAGCGATGCTCCTACC 

6000 

HeCAanGluArgAlaAap 
CysGlnMetCyaPheLeuAsnLysGlyLeuGlylleCysIyrGluArgLyaGlyArgArg 
ATTGTCAGATGT6CTTTCTAAACAAGGGGCTCGGGATATGTIAIGAACGAAA6GGCA6AC 

GluGluGlyLeu6lnArgLy8LeuArgLeuIleArgLeuLeaHisGlnThrS«r,GluTyr 

MeC 

ArgArgThrProLysLy8ThrLy8ThrHi8ProSerProThrProA8pI.y» 
GAAGAAGGACTCCAAA6AAAACTAA6ACTCATCC6TCTCCTACACCAGACAAGTGA6TAI 

6100 

AspGluSerAlaAlaXyrCysBisPhelleSer 
MetAsnGlnLeuLeulleAlalleLeuLeuAlaSerAlaCysLeuVallyrCyaThrGln 

GATCAATCAGCTGCTTATTGCCATTTTATTA6CTAGTGCTT6CTTA6TATATTGCACCCA 

. . , . • • • 

TyrValThrVaiPheTyrGlyValProThrTrpLysAsnAlaThrlleProLeuPheCys 

ATATGTAACTGTTTTCTATGGCGTACCCACGTGGAAAAATGCAACCATTCCCCTCTTTTC 

6200 • • • 

AlaThrArgAsnArgAapThrTrpGlyThrlleGlnCysteuPToAspAanAspAspTyr 

TGCAACCAGAAATACCGATACTT6GGGAACCATACAGTCCTTGCCTGACAATGATGATTA 

6300 

GlnGluIleThrLeoAsnValXhrGluAUPheAspAlaTrpAanAsnThrValThrCltt 
TCAGGAAATAACTTTGAATCTAACAGAG6CTTTIGAIGCAIGGAAIAATACAGIAACAGA 

GluAlalleCluAspValTxpHisLeoPheGlttThrSerlleLysProCyaValLysLeu 
ACAACCAATAGAAGATGTCTGCCATCTATXCGAGACATCAATAAAACCAICtGTCAAACT 

•(ftg.lA-sufte 5) . • 
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ThrFroLeuCysValAlaMetLysCysSerSerThrCluSerSerThrClyAsnAsnThr 
AACACCTTTATGTGTAGCAATCAAATGCACCAGCACACAGAGCACCACACCCAACAACAC 

• • • • ; • • 

ThrSerLysSerThrSerThrThrThrThrThrProThrAspGlnGluClnGluIleSer 
AACCTCAAAGAGCACAAGCACAACCACAACCACACCCACAGACCAGGAGCAAGAGATAAG 

6500 • . • • 

GluAspThrProCysAlaArgAlaAspAsnCysSerGlyLeuGlyGluGluGluThrllc 
TGAGGATACTCCATGCGCACGCGCAGACAACTGCTCAGGATTGGGAGAGGAAGAAACGAT 
. . . . . 6600 

AsnCysGlnPheAanMetThrGlyLeuGluArgAspLysLysLysGlnTyrAsnGluXhr 
CAATTGCCAGTTCAATATGACAGGATTAGAAAGAGATAAGAAAAAACAGTATAATGAAAC 

• • • • • • 

TrpTyrSerLyaAapValValCyaGluThrABDAanSerThrAsnGlnThrGlnCyaXyr 
ATGGTACTCAAAAGATGTGGTTTGTGAGACAAATAATAGCACAAATCAGACCCAGTGTTA 

6700 

I^ecAsnHisCysAsnThrSerVallleThrGluSerCysAspLysHisTyrTrpAspAla 
CATGAACCATTGCAACACATCAGTCATCACAGAATCATGTGACAAGCACTATTGGGATGC 

• • • • • 

IleArgPheArgTyrCysAlaProProGlyTyrAlaLeuLeuArgCysAsnAspTbrAan 

TATAAGGTTTAGATACTGTGCACCACCGGGTTATGCCCTATTAAGAXGTAATGATACCAA 

6800 . . ♦ • 

TyrSerGlyPheAlaProAsnCysSerLyfiValValAlaSerThrCyaXhrArgMetMet 
TTATTCAGGCXXXGCACCCAACXGXXCXAAAGXAGXAGCXXCXACAXGCACCAGGAXGAX 

.... ^900 
GluThrGlnXhrSerXhrXrpPheGlyPheAanGlyXhrArgAlaGluAsnArgXhrXyr 
GGAAACGCAAACXXCCACAXGGXXXGGCXXXAAXGGCACXAGAGCAGAGAAXAGAACAXA 

• . • • * . *" 
IleXyrXrpHiaGlyArgAapAsnArglhrllelleSerLeuAanLysXyrXyrAanL^u 

TAXCXATXGGCAXGGCAGAGAXAAXAGAACXAXCAXCAGCXXAAACAAAXAXXAXAAXCf 

7000 

SerLeuHiaCysLyaArgProGlyAsnLysXhrValLyaGlnlleMctLeuMetSerGly 
CAGTXXGCAXXGXAAGAGGCCAGGGAAXAAGACAGXGAAACAAAXAATGCXXAXGXCACC 

• . . ♦ • * 

HisValPheHieSerHiaXyrGlnProIleAsnLysArgProArgGlnAlaXrpCyaXrp 
ACATGXGXXXCACXCCCACXACCAGCCGAXCAAXAAAAGACCCAGACAAGCAXGGXGCXG 
7100 . 

PheLysGlyLyaXrpLyaAapAlaMetGlnGlttValLysGluXbrLeoAIaLyaHisPro 
GXXCAAAGGCAAAXGGAAAGACGCCAXGCAGGAGGXGAAGGAAACCCXXGCAAAACAXCC 

7200 

ArgXyrArgGlyXhrAsnAapXbrArgAanlleSerPheAlaAlaProGlyLyaGlyScr 
CACGXAXAGACGAACCAAXCACACAAGCAAXAXXAGCXXXGCAGCGCCAC6AAAAGGCXC 

T . . • • • • 

AapProGluValAlaXyrMetXrpXbrAsnCysArgGIyGluPheLeuXyrCysAsnMet 

AGACCCAGAAGXAGCAXACAXGXGGACXAACXGCAGAGGAGAGXXXCXCXACXGCAACAX 

7300 

XhrXrpPheLeuAsnXrpIleGlttAanLysXbrHiaArgAanXyrAlaProCysHialle 
GACXXGGXXCCXCAAXXGGAXAGAGAAXAAGACACACCGCAAXXAIGCACCGXGCCAXAX 

• . * p • • 

LysGlnllelleAsnXbrXrpHialysValGlyArgAanValXyrLeuProProArgGlu 
AAAGCAAAXAAXXAACACAXGGCAXAAGGXAGGGAGAAAXGXAXAXXXCCCXCCCAGGGA 

, 7A00 • • • • 

GlyGluLeuSerCydAaaSerXbrValXbrSerllelleAlaAsnlleAapXrpGlnAaa 
AGGGGAGCXGXCCXGCAACXCAACAGXAACCAGCAXAAXXGCXAACAXXGACXGCCAAAA 

7500 

AdnAanGlnXbrAanlleXbrPbeSerAlaGlttValAlaGIuLeuXyrArgLeuGluLeu 
CAAXAAXCAGACAAACAXXACCXXXAGXGCAGAGGXGGCAGAACXAXACAGAIIGCACXX 

GlyAspXyrLyaL uValGluIleXhrPr IleClyPbeAIaPr XbrLyaGlaLyaArg 
GGCAGAXXAXAAAXXGGXAGAAAXAACACCAAXXGGCXXCGCACCXACAAAAGAAAAAAG 

. ,x 7600 
(fig.lA-suite 6) 
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TyrSerSerAUHisGlyArgHiaThrArgClyValPheValLeuGlyPheLeuClyPhe 
ATACTCCTCTGCTCACGCCACACATACAAGACGTCTCTTCCTCCTAGGCTTCTTGCCTTT 

LeuAUThrAlaGlySerAlaMetGlyAlaAlaScrLeuThrValSerAlaGlnSerArg 
TCTCGCAACAGCACGTTCTGCAATGGGCGCGGCGTCCCTGACCGTGTCGGCTCACTCCCC 

7700 . • • 

ThrLeuLeuAlaGlylleValGlnGlnGlnClDGlnLeuLeuAspValValLysArgGln 
GACTTTACTGGCCGGCATAGTGCAGCAACAGCAACAGCTGTTCGACGTCGTCAAGAGACA 

GlaGluLeuLeuArgLeuTbrValTrpGlyTbrtyaAsnLeuGlnAlaArgValThrAla 
ACAAGAACTGTTGCGACTGACCGTCTGGGGAACGAAAAACCTCCAGGCAACAGTCACTGC 

* • • • • * 

IleGluLysTyrLeuGlnAspGlnAlaArgLeuAsnSerTrpGlyCyBAlaPheArgGln 

TATAGAGAAGTACCTACAGGACCAGGCGCGGCTAAAXTCATGGGGATGTGCGTTTACACA 

. . 7900 

ValCysHisThrXhrValProTrpValAsnAspSerLeuAlaProAspTrpAspAsnMet 
AGTCTGCCACACTACTGTACCATGGGTTAATGATTCCTTAGCACCTGACTGCGACAATAT 

• • • • 

ThrlrpGlnGluTrpGluLyaGlnValArgTyrLeuGluAlaAsnlleSerLysSerLeu 

GACGTGGCAGGAATGGGAAAAACAAGTCCGCTACCTGGAGGGAAATATCAGTAAAAGTTT 

, 8000 • • • • 

GluGlnAlaGlnlleGlnGlnGluLyeAenMetTyrGluLeuGlnLysLeuAafiSerTrp 
AGAACAGGCACAAATTCACCAAGAGAAAAATATGTATGAACTACAAAAATTAAATAGCTG 

. • . - 8100 

AapIlePbeGlyAsnTrpPheAspLeuThrSerTrpValLyaTyrlleGlnTyrGlyVal 
GGATAXTTTTGGCAATTGGTTTGACTTAACCTCCTGGGTCAAGTATATTCAATATGGAGt 

• • • • • • 

LeuIleIleValAlaValIIeAlaLeuArgIleValIleTyrValValGlnM€tLettS€t# 

GCTTATAATAGTAGCAGTAATAGCTTTAAGAATAGTGATATATGTAGTACAAATGTTAAG 

8200 

AlaCysPbeLcuPheProProArgLeuTyrProThrAsp 
ArgLeuArgLysGlyTyrArgProValPbeSerSerProProGlyTyrlleGlnGlnlle 
GlyLeuGluArgAlalleGlyLeuPbeSerLeuProProProValHeSerAcnArgS r 
TACCCTTAGAAAGGGCTATAGGCCTGTTTTCTCTTCCCCCCCCGGTTATATCCAACAGAT 

ProTyrProGlnGlyProGlyThrAUSerGlnArgArgAsnArgArgArgArgTrpLys 
HigIleHiflLy«A8pArgClyClnProAlaA»aC luG luThrGluG luAapG lyGlySer 
IleSerTbrArgTbrGlyAapSerGlnProTbrLysLysGlnLysLyaTbrValGluAla 
CCATATCCACAAGCACCGGGGACAGCCAGCCAACGAAGAAACAGAAGAAGACGGTGGAAG 
8300 . 

GlaArgTrpArgGlnlleLeuAlaLeuAlaAspSerlleTyrTbrPhePrpAspProPro 
AsnGlyGlyAspArgTyrTrpProTrpProIlcAlaTyrlleHxsPbeLeuIlcArgdln 

TbrValGluTbrAapTbrGlyProGlyArg 
CAACGGTGGAGACAGATACTGGCCCTGGCCGATAGCATATATACATXTCCTGATCCGCCA 

8400 

^ AlaAspSerProLeuAspGlnXbrllcGlnHisLeuGlnGlyLeuThrlleGlnGlttLeu 
LeuIleArgLeuLeuIbrArgLeuXyrSerIleCy8ArgABpLeuI.cuSerArgSerPbe 
GCXGAXXCGCCXCXXGACCAGACTAXACAGCAXCTGCAGGGACXXACXAXCCAGGAGCXT 

* • • • • • 

ProAspProProXbrHiaLeuProGluSerGlnArgLeuAlaGluXbr 

LeuXbrLeuGlnLeuIleXyrGlttAanLeuArgAspXrpLeuArgLeuArgXbrAlaPbc 
CCXGACCCXCCAACXCAXCXACCAGAAXCXCAGAGACXCGCXGAGACXXAGAACAGCCXX 

8500 

LeuGlnXyrGlyCysGluXrpIleGlnGluAlaPbeGlnAlaAlaAlaArgAlaXbrArg 
MetGlyAlaSerGlySerLysLysHisSerArgProProArgGlyL uClnGlu 
CXXGCAAXAXGGGXGCGAGXGGAICCAAGAAGCAXXCCAGGCCGCCGCGAGGGCXACAAG 

(f ig.lA-suite 7) 
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GlttThrLeuAlaGlyAlaCyeArgCljL uTrpArgVall uC UArgI leC lyArgG ly 
ArgLeuLeuArgAlaArgAlaGlyAlaCysClyClyTyrTrpAsnGluSerGlyGlyGlu 
AGACACTCTTCCCGCCCCCTGCAGCCGCTTCTGGAGGCTATTCGAACGAATCCCGACGCC 

8600 . . • • 

IleLcuAlaValProArgArglleArgClnClyAlaCluIleAlaLeuLeu 
TyrSerArgPheClnGluGlySerAspArgGluGlnLysSerProSerCyaGluGlyArg 
AATACTCGCGCTTCCAAGAACCATCAGACAGGGAGCACAAATCGCCCTCCTGTGAGCGAC 

« . • • ♦ 8700 

GlnTyrGlnGlnGlyAspPheMetAanThrProTrpLysAspProAlaAlaGluArgCltt 
GGCAGIATCAGCACGCAGACTTTATGAATACTCCATGGAAGCACCCAGCAGCAGAAAGCG 

LysAsnLeuTyrArgGlDGlnAanMetAspAspValAspSerAapAapAspAspClnVal 
AGAAAAATTTGTACAGGCAACAAAATATGGATGATGTAGATICACATGATGATGACCAAG 

8800 ' » 

ArgValSerValThrProLysValProLeuArgProMetThrHisArgLeuAlalleA p 
TAAGACTTTCTGTCACACCAAAAGTACCACTAAGACCAATGACACATAGATTGGCAATAG 

. • • ♦ • 

MetSerHiBLeuIleLysThrArgClyGlyLeuGluGlyMetPheTyrSerGluArgATg 

ATATGTCACATTTAATAAAAACAAGGGGGGGACTGGAAGGGATGTTTTACACTGAAAGAA 

8900 . . • • 

HisLysIleLeuAsnlleTyrLeuGluLysGluGluGlyllfilleAlaAspTrpGlnAan 

GACATAAAATCTTAAATATATACTTAGAAAAGGAAGAAGGGATAATTGCAGATTGGCAGA 

9000 

TyrThrHiaGlyProGlyValArgTyrProMetPhePheGlyTrpLeuTrpLysleoVal 
ACTACACTCATGGGCCAGGAGTAACATACCCAATGTTCTTTGGGTGGCTATGGAAGCTA6 

• • • 

ProValAspValProGlnGluGlyGluAapThrGluThrHiaCysLeuValHiflProMfl 
TACCAGTAGATGTCCCACAAGAAGGGGAGGACACTGAGACTCACTGCTTAGTACATCCAG 

9100 

GlnThrSerLysPheAapAapProHisGlyGluThtLeuValTrpGluPheAspProLeu 
CACAAACAAGCAAGTTTGATGACCCGCATGGGGAGACACTAGTCtGGGAGTTTGATCCCX 

LeuAlaTyrSerXyrGluAlaPhelleArgTyrProGluGluPheGlyHisLyaSerGly 
TGCTGGCTTATAGTTACGACGCTTTTATTCGGTACCCAGAGGAATTTGGGCACAAGTCAC 

9200 . . . • 

LeuProCluGluGluTrpLyaAlaArgLeuLysAlaArgGlylleProPbeSer 
GCCTGCCAGAGGAAGAGTG6AAGGCGAGACTGAAAGCAAGAGGAATACCATTTAGTTAAA 

• "00 

GACAGGAACAGCTATACTTGGTCAGGGCAGGAAGTAACTAACAGAAACAGCTGAGACT6C 

AGGGACTTTCCAGAAGGGGCTGTAACCAAGGGAGGGACATGGGAGCAGCTGGTGGG6AAC 

. t . 9400 

GCCCTCATATTCTCTGTATAAATATACCCGCTAGCTTGCATTGTACTTCGGTCGCTCTGC 

. • • . . 

GGAGAGGCTGGCAGATTGAGGCCTGGGACGTTCTCTCCAGCAGTAGCAGGTAGAGCCTGG 

.\ 9500 - 4 1 - - • 

GTCTTCCCTGCTAGACTCTCACCAGCACTTGGCCGGT6CTGGGCAGACGGCCCCACGCTT 

GCTTGCTTAAAAACCTCCTTAATAAAGCTGCCAGTTAGAAGCA 



(fig.lA-sulte 8) 
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FIG IB 



ACTCCCTCTGCGCACACCCTGCCACATTGACCCCTtJCCACCTTCTCTCCACCACTACCAC 

• ••••• 

GTAGAGCCTGGGTCTTCCCTGCTAGACTCTCACCAGCACTTCGCCCGTCCrcCCCACAGT 

, • . 100 

GCCTCCACCCTTGCTTGCTTAAACACCTCTTCAATAAACCTCCCATTTACAAGTAACCTA 

««•••• 

CTCTCTGTTCCCATCTCTCCTAGTCCCCCCCTGCTCAACTCGCTACTCCGTAATAAAAAG 
. 200 • . • • 

ACCCTGGTCTCTTACGACCCTGCTCTGTTAGCACCCTTTCTGCTTTGCGAAACCCAAGCA 

300 

CGAAAATCCCTAGCAGATTGGCGCCCCAACAGGGACTTGAAGGAGAGTCAGAGACTCCTC 

ACTACCGCTGAGTGAACGCAGTAAGC6CCCCAGGAACCAACCACGACCGAGTCCTCCTAC 

^00 • • 

AAAGGCGCGGGTCGGTACCACACCGCGT6ACGACCGGGGAGAGAAGA6GCCTCCTGGTTC 

• ••••• 
CAGGTAACTGCAACACAAAAACGAAATA6CTGTCTTTTATCCAG6AACCCATAATAACAT 

500 « • • • 

GAGDMETGLYALAARGASNSERVALteuSERGLYLYSLYSALAASPCLULEUGLU 

AGAGTCGGAGATGGGCGCGAGAAACTCCCTCTTGTCACGGAAGAAACCAGATCAATTAGA 

600 

LYSILEARGLEUARCPROGLYGLYLYSLYSLYSTYRHETLeULYSHISVALVALTRPALA 
AAAAATTAGACTACGACCCGGCCGAAAGAAAAACTACATGTTCAAGCATCTA6TATGGGC 

ALAASNGLULEUASPAftCPHECLYLEUALAGLUSERLEULEUGLUASNLYSCLUCLYCYS 
AGCAAATGAATTAGATAGATTTGGATTAGCAGAAAGCCTGTT6GAGAACAAACAAGCATC 
« • • 700 • • 

GLNLYSILELEUSERVAUEUALAPROUEUYALPROTHRGLySERGLUASNUEUUYSSER 

TCAAAAAATACTTTCGGTCTTACCTCCATTAGTGCCAACAGCCTCAGAAAATTTAAAAAC 

LEUTYRASNTHRVALCYSVALILETRPCYSILEHISALAGLUGLULYSVALLYSHISTHR 
CCTTTATAATACTCTCTGCGTCATCTGGTGCATTCACGCAGAACAGAAACTCAAACACAC 

• 800 • • • • 
GLUGLUALALYSGUNILEVALGLNARCHISLEUVALHETGLUTHRGLYTHRALAGLUTHR 

TGAGGAAGCAAAACACATAGT6CA6AGACACCTAGTCATGCAAACAGCAACACCACAAAC 

. \ . . .900 

METPROLYSTHRSERARGPROTHRALAPROPHESERCLYARGGLYGLYASNTYRPROVAL 
TATCCCAAAAACAAGTAGACCAACAGCACCATTTAGCGGCACAGGAGCAAATTACCCACT 

CLNGLMILEOLYGLYASMTYRTHRHISLEUPROUEUSERPROARGTHRLEUASNALATRP 
ACAACAAATA6GTCCTAACTATACCCACCTACCATTAAGCCCCACAACATTAAATCCCT0 
« • • 1000 * • 

VALtYSLEUlLEGLUGLULYStYSPHECLYALACLUVALVALSERGLYPHEGLNALALEU 
CGTAAAATTAATAGAGCACAAGAAATTTGGAGCAGAAGTAGTCTCAGGATTTCAGGCACT 

SERGLUGLYCYSLEUPROTYRASPILEASNGLNrtETLEUASMCYSYALGLYASPHISCLN 
CTCAGAAGCCTGCCTCCCCTATGACATTAATCAGATGTTAAATTGTCTGCGA6ACCATCA 

• 1100 • • • « 
ALAALArtETGLMlLEILEARGASPlLEILEASNGLUCLUALAALAASPTRPASPLEUCLN 

ACCCGCTATGCAGATCATCAGACATATTATAAATGAGCACGCTGCAGAT7GGGACTTGCA 

1200 

HISPR06LNGLNALAPR0GLNGLN0LYGLNLEUAR6GLUPROSERGLYSERASPIUEALA 
GCACCCACAACAAGC7CCACAACAAGGACAGCTTAG6CAGCCGTCAGGATCAGATATTGC 

GLYTHRTHRSERTHRVALCLUCLUCLNILEGtNTRPHETTYRARCCLMGLNASNPROILE 
ACCAACAACTA6TACACTACAAGAACAAATCCAGTC6ATCTACACACAACACAACCCCAT 

1300 . 

FIO. IP- 
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PROVALCUYASNlLETYRARCARGTRPILECLNtEUCCYLtUCtNUYSCYSVALARCMET 
ACCACTAGCCAACATTTACACCACATCCATCC AACTCCCCTTCCAAAAATCTCTCACAAT 

• • « • • • 

TYRASNPROTHRASMILELEUASPVALLYSCLNCLYPROLYSCLUPROPHEGLNSERTYR 

CTATAACCCAACAAACATTCTACATCTAAAACAAGGCCCAAAAGACCCATTTCACAGCTA 

l<iOO • • • • 

VAL AS PARGPHETYRLYSSERLEUARGALAGLUGLNTHRASPPROAL AVAIL YSASNTRP 

TGTAGACACCTTCTACAAAAGTTTAAGACCACAACAAACA6ATCCACCAGTAAACAATTC 

1500 

rtETTHRGLNTHRLEULEUILEGLNASNALAASNPROASPCYSLYSLEUVALLEULYSCLY 
GATCACTCAAACACTGCTGATTCAAAATGCTAACCCAGATTGCAAGCTACTCCTGAACCG 

LEUGLYTHRASNPROTHRLEUCLUGLUflETLEUTHRALACYSGLNCLYVALGLYGLYPRO 
GCTGGGTACGAATCCCACCCTAGAAGAAATCCTGACGCCCTOTCAAGGACTACGCGCCCC 

• 1600 • • 

GLYGLNLYSALAARGLEUMETALAGUUALALEULYSGLUALALEUALAPROALAPROILE 
AGCACAGAAGGCTAGATTAATGGCAGAAGCCCTGAAAGAGGCCCTCCCACCAGCCCCAAT 

POLVALLEUGLULEUTRP 
PROPHEALAALAALAGLNGLNLYSGLYPROARGLYSPROILELYSCYSTRPASNCYSGLY 
CCCTTTT6CAGCAGCCCAACAGAAGGGACCAACAAAGCCAATTAACTGTTCCAATTGTCC 

• 1700 • • • • 
GLUGLYARGTHRLEUCYSLYSALAMeTGLNSERPROLYSLYSTHRGLYMETLEUGLUMET 

LYSGLUGLYHISSERALAARGGLNCYSARGALAPROARGARGCLNGLYCYSTRPLYSCYS 
CAAGGAAGGACACTCTGCAAGGCAATCCACAGCCCCAAGAAGACACOGATGCTCGAAATG 

1800 

TRPLYSASNGLYPR0CY$TYRGLYGLNMETPR0LYSCLNTHRGLYCLYPHEPHEARGPRO 

GLYLYSMETASPHISVALH6TALAUYSCYSPR0ASNARCGLNALACLYPHELEUGLYLEU 
TGCAAAAATGGACCATGTTATGGCCAAATGCCCAAACAGACAGGCCGGTTTTTTAGGCCT 

TRPPROLEUGLYLYSCLUALAPROCLNPHEPROHISGLYSERSERAtASERGLYALAASP 

GUYPROTRPGLYLYSLYSPROARGASNPHEPROMETALACLNVALHISGLNGLYLEUTHR 
TGGCCCTTCGC6AAAGAAGCCCCGCAATTTCCCCATCGCTCAAGTGCATCAC6C6CTCAC 

1900 

ALAASNCYS5ERPR0ARGARCTHR5ERCYSGLYSERALALYSGLULEUHISALALEUGtY 

PROTHRALAPROPROGLUGLUPROALAVALASPLeULEULYSASNTYRMETHlSLEUGLY 
GCCAACTGCTCCCCCAGAA<JAACCAGCTGTGGATCTGCTAAAGAACTACATCCACTTCGC 

• • • • ♦ • 
CLNALAALAGLUARGLYSGLNARGCLUALALEUGLNGLYGLYASPARGCLYPHEALAALA 

LYSGUNGUNARGGLUSERARGCLYtYSPROTYRLYSCLUVALTHRGLUASPLEULEUHIS 
CAAGCACCACACAGAAAGCAGACGGAAGCCTTACAAG6AG6TGACAGACGATTTCCTGCA 

• 2000 • • • • 
PROGLNPHESERLEUTRPARCARCPROVALVALTHRALAHISILEGLUGLYCLNPROVAL 

LEUASNSERLEUPHEGLYGLYASPCLN^ 
CCTCAATTCTCTCTTTCGACCAGACCAGTACTCACTCCTCATATTCAA6CACACCCTCTA 

2100 

CLUVALLEULEUASPTHRGLYALAASPASPSERILEVALTHRGLYILECLULEUCtYPRO 
GAAGTATTATTA6ATACAGCGCCTGATGATTCTATTCTAACAGGAATACAGTTAGCTCCA 

HISTYRTHRPROLYSILEVALCLYCLYaECLYCUYPHEIUEASMTHRLYSGLUTYRLYS 
CATTATACCCCAAAAATAGTAGGAGCAATAGCAGGTTTTATTAATACTAAACAATACAAA 

2200 

ASNVAUGLUILEGLUVALLEUGLYLYSARGILELYSGLYTHRILEMETTHRCLYASPTHR 
AAT6TAGAAATACAAGTTTTAGGCAAAACGATTAAAGGGACAATCATGACAGGGGACACC 

PROILEASNILEPHECLYARCASNLEULEUTHRALALEUCLYMETSERLEUASNLEUPRO 
CCCATTAACATTTTTGGTAGAAATTTACTAACAGCTCTGGGGATGTCTCTAAATCTTCCC 

• 2300 . 4 • • 
ILEALALYSVALCLUPROVALLYS SERPROLEUL YSPR0CLYLYSASPGLYPR0LY5LEU 
ATA6CTAAGGTA6ACCCT6TAAAGTCGCCCTTAAACCCACGAAA6GATG0ACCAAAATTC 

2400 

LYSGLNTRPPROLEUSERLYSGLUCYSILEVALAtACEUARCCLUILECYSGLULTSMeT 
AAGCACTGCCCATTATCAAAA6AAAACATACTTCCATTAAGA6AAATCTCTCAAAACATC 

(fig. 12- ulte 1) 



wo 88/05440 



PCT/FR88/00025 



. 12/35 . . 

CLULYSASPCLYCLNLEUCtUGLUALAPROPROTMRASNPROTYRASNTHRPROTMRPHE 
CAAAAACATCCTCACTTCCACCAAGCTCCCCCCACCAATCCATATAACACCCCCACATTT 

2500 

AtAILELYSLYSCYSASPLYSASNtYSTRPARGMCTLEUILEASPPHEAROCLULEUASN 
CCTATAAAGAAAAAGCATAAAAACAAATCCACAATGCTCATACATTTTACCCAACTAAAT 

• « • • • • 

ARCVALTHRGLNASPPHETHRCLUVALGLNLEUCLYILEPROHISPROALAGLYLEUALA 
ACGGTCACTCAAGACTTTACCCAACTCCAATTAGCAATACCACACCCTCCACCACTACCA 

• 2600 . • • • 
LYSARCLYSARGILETHRyALLEUASPILEGLYASPALATYRPHESERILEPROLEUASP 
AAAACCAAAAOCATTACAGTACTGGATATAGGTGACCCATATTTCTCTATACCTCTAGAT 

2700 

GLUGLUPHEARCCLNTYRTHRALAPHETHRLEUPR05ERVALASNA5NALAGLUPROCLY 
GAAGAATTTAGCCAGTACACTGCCTTTACTTTACCATGAGTAAATAATGCACAGCCAGCA 

LYSARGTYRILETYRtYSVALLEUPROGLNCLYTRPLYSCCYSERPROALAILEPHECLN 
AAACGATACATTTATAACCTTCTGCCTCAGGGATGGAAGGGGTCACCAGCCATCTTCCAA 

, • • 2800 

TYRTHRKETARCHISVALLEUCLUPROPHEARGLYSALAASNPROASPYALTHRLEUVAL 
TACACTATCAGACATCTGCTAGAACCCTTCAG6AAGGCAAATCCAGATGTCACCTTA6TC 

• • * • . • • 
CLNTYRMETASPASPILELEUILEALASERASPARGTHRASPLEUGLUHISASPARCVAL 
CAGTATATGGATGACATCTTAATAGCTAGTCACAGGACAGACCTGGAACATGACAGGGTA 

. 2900 • . /• 

VALLEUGLNLEULYSGLULEULEUASNSERILEGLYPHESERSERPROGLUGLULYSPHE 
GTTTTACAGTTAAAAGAACTCTTAAATACCATAGGGTTTTCATCCCCAGAAGAGAAATTC 

• . • 3000 

GLNLYSASPPROPROPHEGLNTRPrtETGLYTYRGLULEUTRPPROTHRtYSTRPLYSLEU 
CAAAAAGATCCCCCATTTCAATGGATGGG6TACGAATTGTGCCCGACAAAATGGAAGTTG 

• • • • • • 

GUNLYSILEGLULEUPROCtNARGGLUTHRTRPTHRVALASNASPILEGLNLYSLEUVAL 
CAAAAGATAGAGTTGCCACAAAGAGACACCTGGACAGTGAATGATATACAGAAGTTACTA 

. 3100 . • * 

GLYVALLEUASNTRPALAALACLNILETYRPROGLYILELYSTHRLYSHISLeUCYSARG 
GGAGTATTAAATTGGCCAGCTCAAATTTATCCAGGTATAAAAACCAAACATCTCTGTAGC 

• • • • • • • 

LEUIL£ARGGLYLYS«£TTHRLEUTHRGLUGtUVALGLNTRPTHRGLU«ETALAGLUALA 

TTAATTAGAGGAAAAATGACTCTAACAGAGGAAGTTCACTCGACTCAGATGGCAGAAGCA 

• 3200 • • ♦ 
CLUTYRCLUGLUASNLYSILEILELEUSERGLNGLUGLNCLUGtYCYSTYRTYRGLNCLU 
6AATATCACGAAAATAAAATAATTCTCAGTCA6GAACAAGAACGATGTTATTACCAACAA 

3300 

SERLYSPR0LEUGLUALATHRVALILELYSSERCLNASPASN6LNTRPSERTYRLYSILE 
AGCAAGCCATTAGAAGCCACGCTGATAAAGACTCAGCACAATCAGTCGTCTTATAAAATT 

• • • • • ♦ 
HISGLNGLUASPLYSILELEULYSVALCLYLYSPHEALALYSILELYSASNTHRHISTHR 
CACCAAGAAGACAAAATACTGAAAGTAGCAAAATTTGCAAAGATAAAdAATACACATACC 

3A00 

ASMGLYVALAR6LEULEUALAH1SVAL1LECLNLYSILEGLYLYSGLUALAILEVALILE 
AATGCAGTTAGACTATTACCACATGTAATACACAAAATAGGAAAGGAAGCAATAGTGATC 

• • • • • • 
TRPGLYGLNVALPR0LYSPHEHISLEUPR0VAL6LULYSASPVALTRPGLUGLNTRPTRP 
TGGGGACAGGTCCCAAAATTCCACTTACCAGTTGAGAACCATGTATGGGAACAGTG6TGC. 

• 3500 • • • • 
THRASPTYRTRPGLNVALTHRTRPILEPROGLUTRPASPPHEILESERTHRPROPROLEU 
ACAGACTATTGGCA6GTAACCTGGATACCGCAATGGGATTTCATCTCAACACCACCATTA 

. . . • 3600 

VALARGLEUVALPHEASNLEUVALLYSASPPROILEGLUGLYCLUGLUTHRTYRTYRVAt 

gtaa<;attagtcttcaatctagtgaaggaccctatagagggagaagaaacctattatcta 

• • • • • • 

aspglysercysserlysclnserlyscluglylysalaglytyrilethrasparccly 

GATCGATCATCTAGTAAACACTCAAAAGAACCAAAAGCAGGATATATCACAGACAGGCCC 

(fig. IB-suite 2 ) 
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• • * • 3700 • • 
LtSASPLYSVALLYSVALLEUCtUCLNTHRTHRASNCLNCLNALACLULEUGLUALAPHE 
AAAGACAAGCTAAAACTCTTACAACACACTACTAATCAACAAGCACAATTCCAACCATTT 

• • « • • • • 
LCUMETALALEUTHRASPSERCLYPR0LYSALAASNIL6 ILEVALASPSERCLNTYRVAL 
CTCATGCCATTGACACACTCAGGCCCAAACCCAAATATTATAGTACACTCACAATATCTT 

3800 « • • • 

ftETCLYlLEILETHRCLYCYSPROTHRGLUSERCLUSERARGLEUVALASNGlNILEILE 
ATGGGAATAATAACAGGATGCCCTACACAATCAGACACCAGCCTAGTTAACCAAATAATA 

3900 

GLUGLUMETILELYSLYSTHRCLUILETYRVALALATRPVALPROALAHISLYSGLYILE 
GAACAAATCATCAAAAACACAGAAATTTATCTGGCATGGGTACCAGCACACAAACGTATA 

• • • • • • 
CLYGLYASNGLNGLUILEASPHISLEUVALSERGLNGLYILEARCGLNVALLEUPHELEU 
GCAGGAAACCAAGAAATAGACCACCTAGTTACTCAAGGGATTAGACAAGTTCTCTTCTTC 

• • • ^000 • « 
GLULYSILEGLUPROALAGLNCLUGLUHISSERLYSTYRHISSERASNILCLYSGLULEU 
GAAAAGATAGACCCACCACAAGAAGAACATAGTAAATACCATAGTAACATAAAAGAATTG 

• • « • • • 
VALPHELYSPHGGLYLEUPROARGLEUVALALALYSGLNILEVALASPTHRCYSASPLYS 
CTATTCAAATTTGGATTACCCAGACTAGTGGCCAAACAGATAGTAGACACATGTGATAAA 

• 4100 • • • « 
CYSHISGLNLYSGLYCLUALArLEHISGLYGLNVALASNSERASPLEUGLYTHRTRPGLH 
TCTCATCAAAAAGGAGAAGCTATACATGCGCAGCTAAATtCAGAeCTAfGGACTTGCCAA 

4200 

hetaspcysthrhisleugluclylvsileyalilevalaLavalhisvalalasercly 
atggattgtacccatctagagcgaaaaatagtcatagttgcagtacatgtagctagtcga 

• • • • • • 

PHE ILECLUALAGLUVALlLEPROGLNGLUTHRGtYARGGLNTHRALALEUPHELEUL EU 
TTCATACAAGCAGAAGTAATTCCACAAGAAACAGGAAGACACACAGCACTATTTCTCTTA 
« « • 4300 • • 

lysleualaserargtrpproilethrhisleuhisthraspasnglyalaasnpheala 
aaattggcaaccacatggcctattacacatctccacacagataatgctcctaactttcct 

serglncluvallysmetyalalatrptrpaUglyilecluhisthrpheglyyalpro 
7cgcaagaagtaaacatggttccatggtcggcagggatacagcacacctttgg0gtacca 

• 44 00 • • • - • 

TYRASNPROGLNSERGLNGLYVALVACGLUALAMETASNHISHISLEULYSASNGLNILE 
TACAATCCACAGAGTCAGaGAGTACTGGAAGCAATGAATCACCACCTCAAAAATCAAATA 

4500 

ASPARGICEARGCUUGLNALAASNSERYALCLUTHRILEYALLEUMETALAVALHISCYS 
GATAGAATCAGGGAACAACCAAATTCAGTAGAAACCATAGTATTAATGCCA6TTCATTCC 

rtETASNPHELY^ARGARGCLYGLYILEGLYASPflETTHRPROALACLUARCLEUILEASN 
ATGAATTTTAAAACAAG6CCACGAATACGGGATATGACTCCA6CACAAAGATTAATTAAC 

• • • 4600 • • 
METILETHRTHRGLUGLNGLUILECLNPHECLNGLNSERLYSASHSERLYSPHELYSASN 
ATCATCACTACAGAACAACAAATACAATTTCAACAATCAAAAAACTCAAAATTTAAAAAT 

• • • • • • 
PHEAR6YALTYRTYRARG6L0GLYARGASPCLNLEUTRPLYSGLYPR0CLYCLULEULEU 
TTTCGGCTCTATTACA6AGAACGCACAGATCAGCTCTGCAACGCACCCGCTCACCTATTC 

• 4700 • • ♦ • 
TRPLYSCLYGLUGLYALAVAtlLELEULYSVALGLYTHRASP ILELYS VALVAL PROARC 
TGCAAACGGGAAGGAGCAGTCATCTTAAAG6TAGGAACAGACATTAA0GTA6TACCCAC6 

• • . 4000 

ARCLYSALALY$ILElLELYSA$PTYRGLYCLYGLYLYSGLU«£TASPSERSERSERHI$ 

* Qmetglugluglulysargtrp ILEVALVALPROTHR 

ACAAAGGCTAAAATTATCAAAGAftATGGAGCAGCAAAACAGATGGATAGTACTTCCCAC 
« • • • • • 

flETCLUASPTHRGLYGLUALAARGGLUVALALA 

TRPARGILEPROGLUARCLEUGLUARGTRPHISSEFLEUaEUYSTYRLEULYSTYilLYS 
AT6CAC6ATACCCGAGACCCTAGAGACGTCCCATA6CCTCATAAAATATTTGAAATATAA 

4900 

Cf ig.lB-sult** 3 ) 
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THRLYSASPLEUCLNLYSALACYSTYRVAtPROHlSHlSLYSYALCLTTRPALATRPTRP 
AACTAAACATCTACAAAACCCTTCCTATGTCCCCCATCATAAGOTCCCATCGCCATCCTC 

• • • • 

TMRCYSSERARCVALILEPHepROUEUCLNCLUCLYSeRHlSLeuCLUVALGLNCLYTYR 

CACCTGCAGCACACTAATCTTCCCACTACAGGAAGGAACCCATTTAGAAGTACAACGGTA 
5000 

TRPASNLEUTHRPROGLUARCCLYTRPLEUSCRTHRTYRAIAVAIARGILETHRTRPTYR 
TTGGAATTTCACACCAGAAACACGGTCGCTCAGTACTTATGCACTGAGGATAACCTGCTA 

5100 

SERLYSASPPHETRPTHRASPVALTHRPROGLUTYRALAASPILELEULEUHISSERTHR 
CTCAAAGCACTTTTGCACAGATGTAACACCACAATATGCAGATATTTTACTCCATACCAC 

TYRPHEPROCYSPHETHRALACLYGLUVALARCARCALAILEARGGLyCLUARCLEULEU 
TTATTTCCCTTGCTTTACACCCGCAGAAGTCAGAAGGGCCATCAGGGGACAACGACTGCT 

5200 

SERCYSCYSARGPHEPROARGALAHISLYSHISGLNVALPftOSERLEUGCNTYRLEUALA 
GTCTTGCTGCACCTTCCCAAGACCTCATAAGCACCAGGTACCAAGTCTACACTACTTACC 

LEUARGVALVAL5ERHISVALARGSERGLNGUGLUASNPR0THRTRPLYSCLNTRPARC 
XHETSERASPPROARGCLUARCILEPftOPROGLYASNSERGLYGLU 
ACTGACAGTAGTAACTCATCTCAGATCCCAGGGAGACAATCCCACCTGCAAACAGTGGA6 

• 5300 . . • • 
ARGASPASMARGAJlGSERLEUARGVALALALYSGLNASNSERARGGLYASfLYSCLNARC 

CUUTHRILECLyGLUALAPHE6LUTRPLEUASNARGTHRVAtGLUGl.UlLEASNARCCLU 
AACAGACAATAGGACAACCGTTCGAGTGGCTAAACAGAACAGTAGAGGAGATAAACACAC 

. . • . • 5^00 

GLYGLYLYSPROPROTHRGLUCLyALAASNPHEPROGLYLEUALAtYSVALLEUGLYILE 
ALAVALASNHISLEUPROARCGLULEUILEPHECLNVALTRPGLNARCSERTRPGLUTYR 
AGGCG6TAAACCACCTACCCAGGGAGCTAATTTTCCAGGTTTGGCAAAGGTC7TGCCAAT 

• • • • 

LEUALA 

TRPHISASPGLUCLNCLYMETSERGLNSERTYRTHRLYSTYRAROTYRLEUCYSLEUILE 
ACTGGCATGATGAACAAGGGAT6TCACAAAGCTATACAAAATACACATACTTGTGTTTAA 

. • 5500 

GLNLYSALALEUPHErtETHISCYSLYSLYSGLYCYSARGCYSLEUGLYGLUGLYHISGLY 
TACAAAAGGCTTTATTTATGCATTCCAAGAAAGGCTGTAGATGTCTAGGGGAAGGACAC6 

• • • ♦ • 

ALACLYGLYTRPARGPROGLyPROPROPROPROPROPROPROGLYLEUALA R WETGUU 
GGGCAGGGGGATGGACACCAGCACCTCCTCCTCCTCCCCCTCCAGGACTAGCATAAATGG 

• 5600 • • 
CLUARGPROPROCLUASNGLUGtYPROCLNARGCLUPROTRPASPGLUTRPVAtVALGLU 

AAGAAAGACCTCCA0AAAATGAAGGCCCACAAAG6GAACCATCCGAT6ACTGG6TACTGC 
. • . ^ • 5700 

VALLEULYSGtULEULYSGLUGLUALALE ULYSHl SPHEASPPROARCLEULEUTHRALA 
AAGTTCT6AAAGAACTGAAAGAACAAGCTTTAAAGCATTTTGATCCTCCGCTTCTAACCC 

• • • • • * • 

TATl METGLUTHRPR0LEUARC6LUGLN6LUASNSER 
LEUGLYASNHISILETYRASNARGHISGLYASPTHRLEUGLUGLYALAGLYGLULEUILE 
CACTTGGTAATCATATCTATAATAGACATGGA6ACACCCTTGAGGGAGCAGCAGAACTCA 

5800 

LEUGLUSERSERASNGLUARGSERSERTYRILESERGLUALAALAALAALAILEPROGLU 

ARGILELEUGLNARGALALEUPHEILEHISPHEARGSERCLYCYSSERHISSE^ARGILE 
TTAGAATCCTCCAACGAGCGCTCTTCATACATTTCAGAAGCCGCTGCACCCATTCCAGAA 

• • • • • • 

SERAUASNLEUCLYGLUGLUILELEUSERGLNLEUTYRARGPROLEUGLUALACYSTYR 

CLYGLNPRQGLYCLYGLYASNPROLEUSERTHRILEPROPROSERARGSERHEtLEU 
TCCGCCAACCTGCGGGAGCAAATCCTCTCTCAACTATACCGCCCTCTACAACCATGCTAT 

• 5900 • . • ♦ 
ASNTHRCYSTYRCYSLYSLYSCYSCYSTYRHISCYSCLNPHECYSPHELEULYSLYSCLY 

AACACATGCTATTGCAAAAACT6TTGCTACCATTCCCAGTTTTGTTTTCTTAAAAAGG6C 

, • • • • 

LEUCLYILESERTYRGLULYSSERHISARGARGARGAR6THRPR0LYSLYSALALYSALA 
ARTirtETARGSERHISTHRGLYGLUGLUGLULEUARGARGARCLEUARCUEU 

(fig. IB-suite 4) 
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nCCCCATAACTTATC*CAACTC*C*CACCACAACAACA*CTCCC*ACAACCCTAACCCT 

ItEHISLfOLEUHISCLNTHRSERtYSTYRCLTLEUJCRTRPLYSJERAtAALATtRAftC 

ENV M£TCLYCY5LEUCtTASNCLNCEUteyIL6ALA 
AATACATCTTCTCCATCAAACCACTAACTATCCCTTCTCTTCCAAATCACCTCCTTATCC 

6100 

"iLeCYSSERUVSCYSLEUTRPILEILECYSILECLNTYRVALTHRVALPHETYRCLTV^ 
CCATCTCCTCTAACTCTCTATCCATTATTTCTATTCAATATOTCACACTCTTTTAKCTC 

PROALATRPARCASNALATHRILEPROLeuPHECYSALATHRUYSASNARCASPTHRTRP 
TACCACCTTCCACCAATCCCACAATTCCCCTCTTCTCTCCAACCAACAATACCCATACTT 

. 6200 • t . » • 

CLVTHRTHRCLNC YSLEU PROASP AS NAS P ASP TYRSERCLULEUALALEUASNVALTHR 
CCCCAACAACTCACTCCCTACCACATAATCATCATTATTCACAATTCCCCCTTAATCTTA 

CLUSERPHeASPAUATRfcLUASNTHRVALTHRCLUCtNAUIUeCLUASPVALTRPCUN 
CASAlccnTCATCCTTCCCACAATACACTCACACAACACCCAATACACCACC 

• .• • • • 

LEOPHECLUTHRSERItELYSPROCYSVALLYSLEUSERPROUOCVSaETHRMTARC 

AACTCTTTCACACCTCAATAAACCCTTCTCTAAAATTATCCCCATTATCCAITACTATCA 
, , 6'*00 • • 

PROCYSvlLVAtHlsJsPASNCYSTHRCUYUEUCLOCLNCtU^^ 
CTCCTtCTCTACTTCATCATAATTCCACACCCTTCCAACAACACCCAATGATAAOCTCTA 

PH6ASNniTTHRCLYt65LYSARCASP^SLYSLY$CLUTYR«NCLO^^ 
AATTCAACATCACACCCTTAAAAACA€ACAACAAAAACCAGTACAATC*AACTTC6TACT 

ALAASPLEUVALCYSCtuaNCLYASH«RTMRCLYASNCtySERARCCtSTYR«6T 
CtCCACATCTCCTTTCTCAACAACCCAATACCACTGCTAATGAAAGTACATCTTACATCA 

TRPHISCLYARCAS^ASNARGTHRILEItESERLEUASNLVSHISTYRASNtEUTO 
ACT6CCATG6TA6A6ATAATAC6ACTATAATTACTCTAAATAA6CATTATAATCTAACAA 

, ♦ 7000 • ♦ 

LYSCYSARGARGPROGLYASNLYSTHRVALLEUPROVALTHRILEHETSERALALEUVAL 

TciAATCTACAACACCACCAAATiAGACAGTTTTA 

• • • • * 

PMEH1SSERCLNPR0VALASMCLOAR6PR0LYSGLNALATRPCYSARGPHEGLY6LYASN 

TT!T«Iac5S!ccSftAATCA6A66CCAAA6CA6GCATG6T6TAG6T7166A 

TRPLYSGLUALAlLELYSGLOVALLYSCLNTHRILEVAtLYSHISPROARCTYRTHRGtY 
ATJwAlwiGjyJtsiAicicCTCAACCAGACCATTCTCAAACATCCCAGCTATACT^ 

THRASNASMTHRASPtYSlLEASNLEOTHRACAPROARGGLYGLYAsJpROGUOVALTHR 

GAACTAACAATACTCATAAAATCAATTT6AC6CCTCCTAGAC6AGCACATCCGCAA67TA 

(f Ig.lB-suite 5) 
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AAAAACCACACCCXeCAGCC ACCCCTCCCAAC ACCTCCTCGCt I u».ca^ 

<f l».lB-8uite 6> 
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5E,i.»£f.o.spi-«o"o'H»»i'r';«"?'^,fy;5;i";t!ipH65K«^^ 

CC^??C?i5IJro5;ti;iS^ci;lilt??S".J?!iAnCC.C.C«TCTCTCCO.CCT 

F ncICHCLY«L» 

„5iISir,;ISUS«K«r.SS^C??oirc?»CC»CC,.CA.T.T«C,CC«C, 
CC;i?f«».tfotl?5S"crcfcl2'Tl^*CACCCCCAA.AAIACAATC.C«AC.* 

lrA^^s^cl^h^^J^i5sssffcl?si^:u^i^^u^^^AI=fc^,cA»c 

.OC.CC0AcW,CC.C.A««ATO,CA,«CCACCT;cj.00..C0A«CC.nCC»^^ 
C.CCC.C.TkTroATOT«.AATATCAC;oC.,TTC«CTCTOTATTCA.TCOC,C,«0 

0»CA«C.»CA«TT0.C«CTC«..«TCTCtCCAOC.CT.CC.«0TACA«CT«. 
T.,TCCCTOOAOACT25rACC.OC.CTT;cCC«CTCCT««A«OTO.C,CCKOCTT 



(f ig.lB-sulte 7) 
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figV ic 

sequence LTR 
CIVET 
versus 
HIV-2 ROD 



X 8960 $970 8980 8990 9000 9010 

TCGAAGGGATTTATTACAGTCCAiiGAAGACATAGAATCTTACACATATACTTACAAAAGG 
: :::::::: ::::::::::: ::::::: : :::::::::::::::: 
TGGAAGGGATGTTTTACAGTGAAAGAAGACATAAAATCTTAAATATATACTTACAAAAGG 
X 8950 8960 8970 8980 8^90 

9020 9030 9040 9050 9060 

AACAAGGCATCATACCAGATTGGCAGATACACTCCGGA CC AGGAATTAGATACCT AA 

tztizzsitzzt :: : : ::::::: it 

AAGAAGGGATAATTGCAGATTGGCAGAACTACACTCATGGCCCAGGACTAAGATACCCAA 

9010 9020 9.030 90^0 9050 

9080 9090 9100 9110 9120 

AGATCTTTGGCTGGCTATGGAAATTAATCCCTGTAAAT6TATCAGATGAGGCACAGGAGG 

: : ::::: ::::::::::: :: : :: ::: :: : :: : 

TGTTCTTTGGGTGGCTATGGAAGCTAGTACCAGTAGATGTCCCACAAGAAGGGGAGGACA 

9070 9080 9090 9100 9110 

9140 9150 9160 9170 9180 

ATGAGGAGCATTATTTAGTGCACCCAGCTCAAACTTCCCAGTGGCATGACCCTTGGGGAG 
:::: :s : ::::: :: ::::: : :::r:;:5 :t : 

CTGAGACTCACTGCTTAGTACATCCAGCACAAACAAGCAAGTTTGATGACCCGCATGGGC 
9130 9140 9150 9160 9170 

9200 9210 9220 9230 9240 

AGGTTCTACCAtGGAAGTTTCATCCAACTCTAGCCTACACTTATGAGGCATATATTAGAT 
it iztz ztz zttzztiztz zz zz zz : ::: zztzz z :::: : : 
AGACACTACTCTGGGAGTTTGATCCCTTGCTGGCTTATAGTTACGAGGCTTTTATTCGCT 
9190 9200 9210 9220 9230 

9260 9270 9280 9290 9300 

ACCCAGAACAGTTTGGAAGCAAGTCAGGCCTGTCAGACAAAGAGGTTAAAAGAAGGCTAG 
zzzzzzz zz ::::::::::::: ::::: :: :: 

ACCCAGAGGAATTTGGGCACAAGTCAGGCCTGCCAGAGGAAGAGTGGAAGGCGAGACTGA 

9250 9260 9270 9280 9290 

9320 9330 9340 9350 

CCGCAAGAGGCCTTCTTGAAATGGCT-GACACGAAGGAAACT 

:::::::: : : : :::::::: : 

AAGCAAGAGGAATACCATTTAGTTAAAGACAGGAACACCTATAGTTGGTCAGGGCA6GAA 
9310 9320 9330 9340 9350 
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9360 9370 9380 9390 
AGCTGACACaGCaGCGACTTTCCACAAGGGGATCTCATC— CCGA 

CTAACTAACAGAAACAGCTGAGACTGCAGGGACTTTCCACAAGGGCCTCTAACCAACGGA 
9370 9380 9390 9^00 9410 

9^00 9410 9420 9430 9440 9450 

GGTACTGGGGAGGACCCCGTTGCGAACACCCACTTTCTTGATGTATAAATATCACTGCAT 

35 !••«••••* ••• • • • • «• 

GGGACATCGGAGCAGCTGGTGCGGAACGCCCTCATATTCTCTGTATAAATATACCCGCTA 
9430 9440 9450 9460 9470 

9460 XX 10 20 30 40 

TTCCCTCTGTA — TTCTCGAAGCGATTTATTACAGTGCA ACAAGACATAGAATCTTAGAC 
• ••••••••••••• • iitiiittiti • 

GCTTGCATTCTACTTCTGGAACGGATGTTTTACAGTCAAAGAAGACATAAAATCTTAAAT 
9490 XX 10 20 30 40 

50 60 70 80 90 
ATATACTTAGAAAAGGAAGAAGGCATCATACCAGATTGGCAGATACACTCCCGA CCA 

:t:::::::::::: ::::::::: :: 

ATATACTTAGAAAAGCAA6AAGCGATAATTGCAGATTCGCAGAACTACACTCATGGCCCA 
50 60 70 80 90 100 

110 120 130 140 ;i50 

C6AATTAGATACCTAAAGATGTTTGGCTGGCTATGGAAATTAATCCCTGTAAATCTATCA 
: ::::s:: :: : : ::::: ::::::::::: :s • :t :::: :: 

GCAGTAAGATACCCAATGTTCTTTCGGTGGCTATGGAAGCTAGTACCAGTAGATCTCCCA 

110 120 130 140 150 160 

170 180 190 200 210 

GATGAG6CACAGGAG6ATGAGGAGCATTATTTAGTGCACCCA6CTCAAACTTCCCAGTGC 

:s:: :::: ::s :::s:::::::s::::s :::: 
CAAGAACGGCAGGACACTGAGACTCACTGCTTAGTACATCCAGCACAAACAAGCAACTTT 
170 180 190 200 210 220 

230 240 250 260 270 

GATGACCCTTGGGGAGAG6TTCTAGCATCGAACTTTGATCCAACTCTAGCCTACACTTAT 
:::::::: :::: ::s s::::::::: :: :: :: : ::: 

GATGACCCGCATGGGCAGACACTACTCTCGCAGTTTGATCCCTTGCTGGCTTATAGTTAC 
230 240 250 260 270 280 

290 300 310 

GAGGCATATATTAGATACCCAGAAGAGTTTGGAAGCA 
• • «• • • 2 S S S * 

CACCCTTTT.ATTCGG 
290 
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( HIV-2.P 
FIG. 2 ^ versus 
' .( HIV-l.P 

I env4 

^ M 

■■ '- !ili::QLtIA r.LA-SACLV y-oyvTY-Y CVPTUKNATI 

HI VI MUVKEKYQKL KRWCWKWCTK LLGIUIICSA TEKLWVTVYY CVPVWKEATT 

5 } " 

60 ■ 70 80 ^^^^ SO 100 

KTV2 PLFCAT. RKR- -DT WC -rrnrTPnynn vnrTTT-HVT EAFDAV/aNTY 

KIVl TLFCASDAKA YDTEVHHVWA THACVPTDPM PQEVV1.VKVT ENFKMHKKDM 

,0 IJO I' 120 env6 no lAO 150 

V1V2 TEQAIEDVWH l-P gTSIgPCV K 1-T?LCVAMgt CSSTSSSTCH HTTSKSTSTT 

*• « * «*«* «**«*«« * * * * * • 

HlVl VEQMHEDllS LWDQSLKPCV KLXPLCVSLK CTDL GB ATHTHSSHTH 



160 170 180 190 200 

JJJV2 --TTTPTDQE QEISEDTPCA RADSCSCLGE SETIKCQFNM TGLERDKKKQ 

15 * *** 

HIVl SSSCEMMMEK CEIK MCSFKIS TSIRCKVQKE YAFFYKLDII 

210 220 tsO env7 240 | 250 

HJV2 Y— NET-HYS KVVCBIHNST "/^T/irvMwiir HTSVITESCD KHTWD|ATRFR 

aiVl PIDHBTTSYT XSC HTSVITQACP KVSFEPIPIH 

20 ... 

260 env8 270 280 290 300 

HTV2 vr.*T>T»r.VAt.t. RC-NPT- BYS GFAPNCSHVV ASTCTRMMET QTSTWF-CFH 

**** * * * * ♦ * ****** 

HIVl YCAPACFAIL KCKKKTFSCT CP-r- CTHVS TVQCTHCIRP WSTQLLL-H 

I 

25 * 

310 320 330 340 350 

K1V2 GTRAE H RTYIYWHCRD H-RTII-SLH KYYULSLKCK RPCHKTVKQI 

^ * « * *«« *♦ ******* 

BlVl GSLAEEEVVl RSAMFT D KAKTIIVQLH QSVE— IHCT RPKNHTRKSI 

360 3^0 380 390 400 

30 «TV2- HUiS— GHVF nggv^vT atTB PROAUCWFKC -KWKD AMQEV KETLAKHPRY 

1, * «»* * * * 

KIVl RIQRGPGEAF VTICR1G:I~ HRQAHCKISR AKWrtAT L KQIASKLREQ 
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I envlO ^i^Q 450 

HIV2 aCXNDTRSls TJ^ JAlt rV^rKWTNC. O.n.VC^HTV rLg -WI-^- 

,,,, rJm.K;-U JkQSS-^C:? EIVTHSFHCC CErFYCRSIQ LF«ST«FHST 

i, 470 envll 480 *90 500 

Y ,„„,t«^u«v vcRKWiPPJi egelscnstv 



yiV2 ■^-r^v^"^" I^^'iri'"'' yCRKVYiLfPJt 

,1,1 WSTEGSNNTE GSPIIILPCIt Jk^FIHMVQE VGKAMYAPPI SGQIRCSS1.I 



5 

WSTEGSNSTE GSDTITLPCR IKqFiWMW^c yw.««.« ^ 

> 

520 530 540 550 
TSIIAHlJiJ HHKQTHIIFS AEVAELYRL- -E^Cl^J^KLV EITPICFA|I. 

aiVl— — JgLLLTrJgC SSJnCSEiJr PGCCDHRDNW RSELYKYKVV KIEPtGVAPT 

■» S70 580 590 600 

HXV2.--. r/^Ssfl S REYRGVF^iS -F.GF.ATA CSAHGAAS- LXVSAQSRT. 
Hivl ^A^Ja-VVQ. WKRAVGI-G ALFLGFLGAA GSTMGARSMt LTVQA-RQI. 

630 i 640 envl 650 

.A«v«5iS iiPV,K»«. u.Lm;TK »» .,vt.t; ^l<;OmnK 

U«V«;«» URAIE»QQ» 1,IQLI7»0« <!L,».I«« ..YLK.QflLLC 

670 680 700 

20 BIV2. .SVGCMsIILhTTVPV— VKBSLAPOV^ 

xJcCSCKtK tLv?VKAS1. SKKSLEQIUH SHTWllEKDRB IHHYTSL2U5 

Hxv2-^-... i^rr^r \«rjl^" ^'^i"^^" 

25 lieesJmW^ JJeQELI.ELD KWAS1.WHWFH ITHWLVYIKI FIMIVCCLVC 



(fig. 2 - suite 1) 
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7 80 7"* 
.eo,»irrllJ V-FSSP?&yi QQIHIHKDRG QPAHEETEED 

*^ * ***** HLPTPRC PDRPEGIEEE 

UIVl LRIVrAVLSI VHRVRQGYSP LSFQT 

* * 840 850 

n„„»SI .tVKC...- ".«.»C. r«.»L— ..tLLI,T.I 

^° „Iu-.'.C ^Qt«,StO S.VStlH*» I«*.OTB«V 

olO 920 930 

aiV2 _ACA?RG LVRV1.ER1GR C».AVPRKia QGAElALt 

HI71 IEVVQGAgL -IRRIPRRia QGLERILL 



(fig. 2 
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( ENV-mac 
FIG. 3 ( versus 
( SXV-ROD 



10 20 30 AO 50 

MGCLCNOLLIAIC— SKCLHIICIQYVTVFYGVPAWRNATIPLFCATKN^OTWGTTQCL 

" : :: : j:::::::s: : tan suit ::: 

MM NOLLIAlLLASACLVY-CTOYVTVFYGVPTHKNATIPLFCATRNRDTHCTIQCL 

10 20 30 AO 50 

60 70 80 90 100 110 

PDNODYSELALNVTESFOAHENTVTEQAIEDVHQLFETSIKPCVKLSPLCITflRCNKSET 

::ss:: : ::::: :::: ::::s:::::j: :js * ' 

PDNOOYQEITLNVTEAFOAWNNTVTEQAIEOVWHLFETSIKPCVKLTPLCVAMKCSSTES 

60 70 80 90 100 110 

120 130 lAO 150 160 170 

DKHGLTKSSTTTASTTTTTTAKSVETRDIVNETS PCVVHDNCTGLEQEPMISCKFNH 

: : : :::::8 s : : : :t j:; 

STGNNTTSKST— STTTTTP T-OOEQEISEOTPCARAOKCSGLGEEET INCQFNM 

120 130 lAO 150 160 

180 190 200 210 220 230 

TGLKRDKKKEYNETWYSADLVCEQGNSTGNESRCYHNHCMTSVIOECCOKOYMDAIRCRY 

::: ::s::s: : ::s s:: : :::s:;::s:j : jss :::s:: :s 

TGLERDKKKOYNETHYSKDVVCETNNST-NOTQCYHNHCNTSVITESCOKHYHOAIRFRY 

170 180 190 200 210 220 

240 250 260 270 280 290 

CAPPGYALLRCNOTNYSGFMPNCSKVVVS.SCTRHMETQTSTHFRFNGTRAENRTYIYHHG 

::::::::::sss::ss:: :::s:s: : s::: ss : :2! J :::: s ::::::::: s. 
CAPPGYALLRCNDTNYSGFAPNCSKVVASTCTRMMETQTSTHFGFNGTRAENRTYIYWHG 

230 2A0 250 260 270 280 

300 310 320 330 3A0 350 

RDNRTIISLNKHYNLTMKCRRPGNKTVLPVTIMSALVFHS— OPVNERPKQAHCRFGGNH 

:s sss* :s: 
RDNRTIISLNKYYNLSLHCKRPGNKTVKOIMLMSGHVFHSHYQPINKRPROAWCWFKCKH 

290 300 310 320 330 3A0 

360 370 380 390 400 

KEAIKEVKOTIVKHPRYTGTNNTDKINLTAPRCC-OPEVTFHHTNCRGEFLYCKMNWFLM 

• : :;:s s «« i mt 

KOAMQEVKETLAKHPRYRCTNDTRNISFAAPGKGSDPEV^YMWTNCRCEFLYCNHTWFLN 

350 360 370 380 390 400 
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4,20 '•30 A<iO ^50 <i60 

HVEDR-iLTTQKPKERHKRNYVPCHIROIINTWHKVCKNVYLPPRECOLTCNSTVTSLIAN 

J J J : ::: :::: :::::::::: ::::::::: : ::::::: ::: 

MIEN KT-H-RNYAPCHIKOUNTHHKVCRNVYLPPRECELSCNSTVTSI IAN 

'i,lQ ^20 A30 AAO '•SO 

^eO '•90 500 510 520 

INWTDCNQTSITMSAEVAELYRLELCOYKLVEITPIGLAPTNyKRYTTG-CTSRNKRCVF 

• • III ISI55;55»«»*««* ••• •♦♦ ♦ • •••• 

iowONNNOTNITFSAEVAELYRLELGDYKLVEITPIGFAPTKEKRYSSAHC— RHTRGVF 
/j60 '•TO <i80 <»70 500 510 

5/»0 550 560 570 580 

VLCFLCFLATAGSAHCAASLTVTAOSRTLLACIV0OQQOLL0VVKRO0€LLRLTVHGTKN 
:::::::::::::::::::: J s :::::::::::::::::: s : : :::::::::::::::: 
VLGFLCFLATAGSAMCAASLTVSAOSRTLLAGIVOQQOOLLDVVKROaeLLRLTVMGTKN 
520 530 5^0 550 560 570 

600 610 620 630 6A0 

LOTRVSAIEKYLKOOAOLNAHGCAFROVCHTTVPHPNASLTPOHNNETHOEHERKVOFLE 
:: :: :::::: ::: :: ::::::::::::::: : :: s:: : :::::: s 
LOARVTAIEKYLQDOARLNSWGCAF RQVCHTTVPHVNDSLAPDWONMTHQEWEKQVRYLE 
580 590 600 610 620 630 

660 670 . 6S0 690 700 

ANITALLEEAQIQOEKNMYELQKLNSHOVFCNWFOLTSHIKriQyGIYIIVGVILLRIVI 

j: i :: si ::::::: :::::::::: :::::: :t: : : ::::: 

ANISKSLEQAOIOQEKNMYELQKLNSWOIFGNHFDLTSHVKYIOYGVLIIVAVIALRIVI 

6A0 650 660 670 680 690 

720 730 7A0 750 760 

YIVQMLARLRQGYRPVFSSPPSYFQ*THTOQ0PALPTKEGKKGOGGGSGGNSSWPWQIEY 

: i ' ' '•• :::sJ!s 
YVVQMLSRLRKGYRPVFSSPPGYIQOIHIHKORGQPANEETEEDGGSNGGDRYHPHPIAY 
700 710 720 730 7^0 750 

780 790 '800 810 820 

IHFLIROLIRLUTHLFSNCRTLLSRAYQILQPIFORLSATYGEFGEVLRLELTYLOYCWS 
::::::::::::: : : :s :::: :: : : : sss :s:8 

IHFLIROLIRLLTRLYSICROLLSRSFLTLOLIYONLROW LRLRTAFLOYCCE 

760 770 780 790 800 

840 850 860 870 880 

YFOEAVOAA-RDLRORLLRA-RGEKLWEALORCGRWILAIPRRIRQCLELTLL 

::::::: : . j : s s : : st 
HIQEAFOAAARATRETLACACRC— LHRVLERIGRCILAVPRRIRQCAEIALL 

810 820 830 840 850 



(fig. 3-3ulte 1) 



wo 88/05440 



PCT/FR88/00025 



25/35 
( GAG-mac 
FIG . 4 (versus 
(GAG-ROD 



10 20 30 ^0 50 

VOHKKEIAVFYPGRDNKIEHEMGARNSVLSGKKADELEKIRLRPGGKKKYML^ 

ss;::-:. ••••• 
M6ARNSVLRGKKA0ELERIRLRPGGKKKYRLKHIVWAAN 

10 20 30 

70 80 ^0 100 110 

ELDRFGLAESLLENKEGCQKILSVLAPLVPTGSENLKSLYNTyCyiWCIHAEEKVKHTE^ 

:::::::: : :s::::::::: 

KLDRFGLAESLLESKECCQKILTVLDPMVPTGSENLKSLFNTVCVIWCIHAEEKVKDTEG 

^0 50 60 70 80 90 

130 140 150 160 170 

AKOIVORHLVMETGTAETMPKTSRPTAPFSGRGGNYPVQOIGGNYTHLPLSPRTLNAHyK 

..... :::: :::::: :: ::::::: : ::s::!s :::::: :::::5::s... 
AKQIVRRHLVAETGTAEKHPSTSRPTAPSSEKCGNYPVOHVCGNYTHIPLSPRTLNAHVK 

100 110 120 130 140 150 

190 200 210 220 230 

LIEEKKFGAEVVSCFQALSEGCLPYDINQHLNCVGOHQAAHQIIRDIINEEAAOHDLOHP 

: ::::::s::s :::::s::: : : : : t J : ? : : « : : J : : : s : « s « s:::::. 
LVEEKKFGAEVVPGFOALSEGCTPYOI NOHLNCVGDHQAAMQI IREIINEEAAEWOVQHP 

160 170 180 190 200 210 

250 260 270 280 290 

OOAPQO-GOLREPSGSOIAGTTSTVEEQIQHMYRQQNPIPyGNIYRRHlQ^ 

: :::::: :::::::: J :::« s « s « « « m :::5::sss» 

IPGPLPAGOtREPRGSOIAGTTSTVEEQIOHHFRPONPVPVGNIYRRWIOlGLOKCVRMY 

220 230 240 250 260 270 

,rtft -310 320 330 340 350 

NPTNILDVKQGPKEPFOSYVORFYKSLRAEOTDPAVKNMHTOTiLIONANPDCKLyLKGL 

:ss::ss z i zz si s s 1 1'. tt : i i a '-^ 

NPTNILOIKQGPKEPFOSYVDRFYKSLRAEOTOPAVKNWMTOTLLVQNANPOCKLVLKGL 
280 290 300 310 320 330 

rjfeo 370 380 390 400 410 

GTNPTLEEMLTACQGVCGPCQKARLMAEALKEALAPAPIPFAAAOQKGPRKPIKCHNCGK 

::::;:::3:::::::3:s::s:s* s!x;!:sssss ••«•••• 

CMNPTLEEMLTACQGVCGP6QKARLHAEALKEVIGPAPIPFAAAQ0 RKAFKCWNCGK 

340 350 360 370 380 390 



FIG. 4 
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i-an AAO ft^O ^70 

EcSs.ROCR*fR2oCCWKC0K«0HVHAKCPN.«CFLCLCP-CKKPR^ 

eohUr«rU»Rocchkcckpghi«nc;or«c^ 
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SmrC pes REHStlCWEMtNTS ittOIQUte SOR LA OtUXltMg FgUltLg 



V OBSERVATIONS LORSOOML A tTt tSTXMt QUE CERTA1NE5 REVEHDICATIOKS NE POUVAIEMT PAS FAIRE 
t'OBJET D UME RECHERCHE ^ . 



S«Ion firtfcto 17^ a) ctrtarn** r»vendtcation»fi'ont pas fait Pobjtt d*un» r»chtrcha pour («« motifs aulvanta: 



T. rn Lea r«vendicalions numiroa. 
c*dar4l*«cntrcho,A«avoir: 



.aa rapportant k un objtt h l'*aafd duqual la prAsanta adminlatraUon n'a paa robBgalfon de pro- 



2* n Las revandi'cationa numiroa aa rapportant * daa partfea da la damanda irrtamationala qui na rampUaaant paa laa conditions 

" preacritas riana una maaura taUa qu'una racharcna tionificativa na paut 4Ua aif actuia, pr^simant: 



3. n Laafa»andteatSonaoum4roa«- wmdaaravandJcattooadapandamaaatnasonipaaradiQAaa 

^ p*waaas da la r*flia 6.4 j> du PCT. 



con(onn«mant ft la dauxf*ma at A la trofaiama 



Vt OBSERVATIONS LORSOUML Y A ABSENCE D'UNiT< DE tMNVENTIOM « 



fadmrniatration chafQia da racharcha Intamatfonala a tiouv* plualaura Inventions dans la priaanta damanda Intamatlonale, c'aat-4-dira: 

Reverxdications 1,2,6-21^23-36 

Revendications 1,2,6-21,23-36 toutes partiellement 3-5 
Revendications 23,25-28,34-36 toutes partiellement 22,24,29 

Comma toutaa lea taxes addmonneUea damand*aa ont 4t« pay4aa dana lea d*lafa» la pr*»ent rapport da recherche intematlonale 
"^^aouvra toulea lea ravandicationa da la damanda Inumationale pouvant faira Toblet d'une recherche. 

2, n Con™ a^rftn*^ P»rte dea taxea addllionnaHea damand^ea a M payte dana lea <»«»»^ »^P^*^ "K!! HJ^f!!!^^!'^'^^^^ 
^ couvre aeuiementceuea daa rwfaodicationada la damanda pour lasquettea lea taxaa ont *t« pay*ea, c eat-A-<»ra lea f»»endlcatio«a- 

3. □ Aucunataxa addlUonnalle demand*e n'a M payte dana laa d*IaiV par (a d*poaant En cona*quenca. te present rapport da recherche 

Intematlonala est limit* k rinverttlon mentionn*e en premier dana Ita revendicatJona; alle eat cowerta par lea ratandicatipna 



numiroa: 



4. PI Etant ,donn« oua toutes laa rsvandicationa suacsptiblea 

^ una taza additionnatle, radmintauation chargie da la recherche 

Remarque quant k la riaarve 

Q Us taxaa addlUonnellea de recherche italent accompaenHa d'una riaarre du d*ppaant 

^ Aucuna riaarva n*a M f atte fore du paiemant dea taaea additlonnallea da rechercha. 



de faira robjat d'una recherche le pouvaient aana effort partieulier f uatfflant 
eherche Intematlonala n'a soincit* te paiemem d'aucune taxa additionnalle. 
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ANNEXE AU RAPPORT DE RECHERCHE INTERNATIONALE 
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SA 20445 

La presente annexe indiqtie les membres de la faiiuUe de brevets rdatife aux documents brevets dt*s dans le rapport de 

K'rrf coTent'^^ier infon„atj,«e de .'Omce europeen des ^^^^.f^^^^^J^^^ 
LSVensetgncments foumis sont donnes a ritre indicatif et n'engagent pas la responsabilite de 1 OIHce enropeen des ftrevets. 
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Pour toot re«seigDeme«rt concemant cette annexe : voir Journal Offtcid de fOfficc etoropeen des brevets, No.I2/82 



